pandas 中聚合分组功能的使用问题

假设我有一个ratings=pd.DataFrame()，数据如下

代码：

ratings = pd.DataFrame([[1,2,3],[2,3,4],[3,4,5],[1,3,4],[1,4,5],[6,7,3],[3,8,1],[5,9,2]], columns=['userID','itemID','rating'])
ratings['label']= ratings['rating']
ratings['label'][ratings['rating']>=4] = 1.0
ratings['label'][ratings['rating']<4] = 0.0

如果想实现以下数据分组

我可以通过

interact_status = ratings.groupby('userID')['itemID'].apply(set).reset_index().rename(
            columns={'itemID': 'interacted_items'})

来实现上述结果

现在我想实现以下的数据分组，将itemID和rating用列表整合（以userID=1为例），这个问题我不知道怎么解决

希望有懂pandas使用的朋友解答一下，不甚感激！

python pandas groupby apply

学好pandas

4 声望

暂无个人描述~

0 人点赞

推荐文章：

更多推荐...

置顶

[进度 100.00%] Python Masonite 4.0 中文翻译召集（Python 中的类 Laravel 框架） 15 / 20 |

博客

2021年python库大全 30 / 5 |

公告

Python Masonite 框架中文翻译召集（Python 中的类 Laravel 框架） 24 / 25 |

博客

收集了一些各大网站 python 的登陆方式,希望对学习 python 的小白，和想写爬虫的你们有所帮助,,本项目用于研究和分享各大网站的模拟登陆方式 17 / 5 |

翻译

Python 3.7 的一些新特性 10 / 2 |

公告

一起学 Python 《Python 最佳实践指南》翻译召集 16 / 2 |

Jason990420

1.9k 声望 / 個人 @ 個人

最佳答案

[itemID, rating] 与 groupby 无关, 所以我就先建了一个栏位, 再来 groupby.

ratings['interacted'] = ratings.apply(lambda row:[row.itemID, row.rating], axis=1)
interacted_status = ratings.groupby('userID')['interacted'].apply(list).reset_index().rename(
            columns={'itemID': 'interacted'})

6年前评论

学好pandas （楼主）

思路是正确的，最后那个rename不用加了

讨论数量: 1

Jason990420

1.9k 声望 / 個人 @ 個人

[itemID, rating] 与 groupby 无关, 所以我就先建了一个栏位, 再来 groupby.

ratings['interacted'] = ratings.apply(lambda row:[row.itemID, row.rating], axis=1)
interacted_status = ratings.groupby('userID')['interacted'].apply(list).reset_index().rename(
            columns={'itemID': 'interacted'})

6年前评论

学好pandas （楼主）

思路是正确的，最后那个rename不用加了

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

pandas 中聚合分组功能的使用问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

pandas 中聚合分组功能的使用问题

推荐文章：

社区赞助商

关于 LearnKu

资源推荐

服务提供商

其他信息

请登录