有了koalas 和pyspark以后还需要学习numpy和pandas么?
看了知乎上一些关于pyspark和koalas的文章,感觉和numpy,pandas做同样的事情,但是处理数据量更大,速度更快,更节省内存。如果以上理解没错,那还需要学习后两者么?
如果认识有误,还请指出错在哪里,谢谢!最好能举例说明。