2021年python库大全

一、算法设计

Python的数据结构,算法和设计模式的实现。另请参阅真棒算法

  • 演算法
  • 设计模式
    • PyPattyrn-一个简单但有效的库,用于实现常见的设计模式。
    • python-patterns -Python中设计模式的集合。
    • transitions -一种轻量级的,面向对象的有限状态机实现。

二、声音、视频、图像、文字处理

用于处理音频及其元数据的库。

  • 声音的
    • audioread-跨库(GStreamer +核心音频+ MAD + FFmpeg)音频解码。
    • dejavu-音频指纹识别。
    • kapre - Keras音频预处理器
    • librosa-用于音频和音乐分析的Python库
    • matchering -一个用于自动参考音频制作的库。
    • mingus-带有MIDI文件和播放支持的高级音乐理论和乐谱包。
    • pyAudioAnalysis-音频特征提取,分类,分段和应用。
    • pydub-使用简单易用的高级界面处理音频。
    • TimeSide-开放的Web音频处理框架。
  • Metadata
    • beets-音乐库管理器和MusicBrainz标记器。
    • eyeD3-一种用于处理音频文件的工具,特别是包含ID3元数据的MP3文件。
    • mutagen-处理音频元数据的Python模块。
    • tinytag-用于读取MP3,OGG,FLAC和Wave文件的音乐元数据的库。

用于处理视频和GIF的库。

  • moviepy-用于基于脚本的电影编辑的模块,具有多种格式,包括动画GIF。
  • scikit-video -SciPy的视频处理例程。
  • vidgear-最强大的多线程视频处理框架。

用于处理图像的库。

  • hmap-图像直方图重新映射。
  • imgSeek-使用视觉相似性搜索图像集合的项目。
  • nude.py-裸露检测。
  • pagan -复古identicon(阿凡达)根据输入的字符串和哈希生成。
  • pillow-枕头是友好的PIL叉。
  • python- barcode-在Python中创建条形码,没有任何额外的依赖关系。
  • pygram-类似Instagram的图像过滤器。
  • PyMatting -Alpha遮罩的库。
  • python-qrcode-一个纯Python QR Code生成器。
  • pywal-一种从图像生成配色方案的工具。
  • pyvips-具有低内存需求的快速图像处理库。
  • Quads -基于四叉树的计算机艺术。
  • scikit-image-用于(科学)图像处理的Python库。
  • thumbor-智能影像服务。它可以按需裁剪,调整图像大小和翻转图像。
  • wand - MagickWand的Python绑定,ImageMagick的C API。

用于解析和处理纯文本的库。


三、日期和时间

用于处理日期和时间的库。

  • Arrow-一个Python库,提供了一种明智且人性化的方法来创建,操作,格式化和转换日期,时间和时间戳。
  • Chronyk-一个Python 3库,用于解析人类编写的时间和日期。
  • dateutil-标准Python datetime模块的扩展。
  • delorean-一个库,用于清除与日期时间有关的不便的事实。
  • maya-人类的日期时间。
  • moment -一个Python库用于处理日期/时间。受到Moment.js的启发。
  • Pendulum-Python日期时间变得容易。
  • PyTime-一个易于使用的Python模块,旨在按字符串操作日期/时间/日期时间。
  • pytz-世界时区定义,现代和历史。将tz数据库带入Python。
  • when.py-提供用户友好的功能来帮助执行常见的日期和时间操作。

四、爬虫

自动执行Web抓取。

用于提取Web内容的库。

  • html2text-将HTML转换为Markdown格式的文本。
  • lassie-人类的Web内容检索。
  • micawber-一个小型库,用于从URL中提取丰富的内容。
  • newspaper -Python中的新闻提取,文章提取和内容管理。
  • python- readability - arc90的可读性工具的快速Python端口。
  • requests-html –适用于人类的Pythonic HTML解析。
  • sumy-自动汇总文本文档和HTML页面的模块。
  • textract-从任何文档,Word,PowerPoint,PDF等中提取文本
  • toapi-每个网站都提供API。

五、HTML、XML

用于处理HTML和XML的库。

  • BeautifulSoup-提供Pythonic惯用法来迭代,搜索和修改HTML或XML。
  • bleach –基于白名单HTML清理和文本linkification库中的。
  • cssutils-一个Python的CSS库。
  • html5lib-一个符合标准的库,用于解析和序列化HTML文档和片段。
  • lxml-一个非常快速,易于使用的通用库,用于处理HTML和XML。
  • MarkupSafe-为Python实现XML / HTML / XHTML标记安全字符串。
  • pyquery-用于解析HTML的类似jQuery的库。
  • untangle –将XML文档转换为Python对象,以方便访问。
  • WeasyPrint-用于HTML和CSS的可视渲染引擎,可以导出为PDF。
  • xmldataset-简单的XML解析。
  • xmltodict-使用XML就像使用JSON。

六、HTTP客户端

使用HTTP的库。

  • grequests-异步HTTP请求的request + gevent。
  • httplib2-全面的HTTP客户端库。
  • httpx-用于Python的下一代HTTP客户端。
  • requests -HTTP对人类的请求。
  • treq -Python请求,例如在Twisted的HTTP客户端之上构建的API。

七、office模块

用于解析和处理特定文本格式的库。

  • General
    • tablib -XLS,CSV,JSON,YAML中的表格数据集的模块。
  • Office
    • docxtpl-通过jinja2模板编辑docx文档
    • openpyxl-用于读取和写入Excel 2010 xlsx / xlsm / xltx / xltm文件的库。
    • pyexcel-提供一个用于读取,操作和写入csv,ods,xls,xlsx和xlsm文件的API。
    • python-docx-读取,查询和修改Microsoft Word 2007/2008 docx文件。
    • python-pptx-用于创建和更新PowerPoint(.pptx)文件的Python库。
    • unoconv-在LibreOffice / OpenOffice支持的任何文档格式之间转换。
    • XlsxWriter-一个用于创建Excel .xlsx文件的Python模块。
    • xlwings -BSD许可的库,可以轻松地从Excel调用Python,反之亦然。
    • xlwt / xlrd-从Excel文件写入和读取数据以及格式化信息。
  • PDF格式
    • PDFMiner-一种从PDF文档提取信息的工具。
    • PyPDF2-一个能够拆分,合并和转换PDF页面的库。
    • ReportLab-允许快速创建丰富的PDF文档。
  • Markdown
  • YAML
    • PyYAML-适用于Python的YAML实现。
  • CSV
    • csvkit-转换为CSV并使用CSV的实用程序。
  • Archive
    • unp-一个命令行工具,可以轻松地解压缩档案。

八、序列化

用于序列化复杂数据类型的库


九、代码分析、测试

码质量检查器的工具。另请参阅令人敬畏的静态分析

  • 代码分析
    • Coala-语言独立且易于扩展的代码分析应用程序。
    • code2flow-将您的Python和JavaScript代码转换为DOT流程图。
    • prospector-分析Python代码的工具。
    • pycallgraph-一个可视化Python应用程序流程(调用图)的库。
    • vulture-查找和分析无效的Python代码的工具。
  • Code Linters
  • 代码格式化程序
    • black –毫不妥协的Python代码格式化程序。
    • isort-用于对导入进行排序的Python实用程序/库。
    • yapf-另一个来自Google的Python代码格式化程序。
  • 静态类型检查器,另请参见awesome-python-typing
  • 静态类型注释生成器
    • MonkeyType-一个用于Python的系统,通过收集运行时类型来生成静态类型注释。
    • pyannotate-自动生成PEP-484注释。
    • pytype -pytype检查并推断Python代码的类型-无需类型注释。

渗透测试的框架和工具。

用于测试代码库和生成测试数据的库。

  • 测试框架
    • hypothesis –假设是一个高级的Quickcheck样式基于属性的测试库。
    • nose2 -nose基于`unittest2。的后继者。
    • pytest-一个成熟的功能齐全的Python测试工具。
    • Robot Framework 通用的测试自动化框架。
    • unittest-(Python标准库)单元测试框架。
  • 测试选手
    • green -干净,多彩的测试运行器。
    • mamba -Python的权威测试工具。生于BDD的旗帜下。
    • tox-自动构建和测试多个Python版本的发行版
  • GUI / Web测试
    • locust-用Python编写的可扩展用户负载测试工具。
    • PyAutoGUI -PyAutoGUI是适用于人类的跨平台GUI自动化Python模块。
    • Schemathesis-用于对基于Open API / Swagger规范构建的Web应用程序进行基于属性的自动测试的工具。
    • Selenium - Selenium WebDriver的Python绑定。
    • sixpack-与语言无关的A / B测试框架。
    • splinter-用于测试Web应用程序的开源工具。
  • Mock
    • doublex-强大的Python测试框架加倍。
    • Frozengun-通过模拟datetime模块来穿越时间。
    • httmock-一个针对Python 2.6+和3.2+的请求的模拟库。
    • httpretty-适用于Python的HTTP请求模拟工具。
    • mock-(Python标准库)一个模拟和修补库。
    • mocket -具有gevent / asyncio / SSL支持的套接字模拟框架。
    • responses 一个实用程序库,用于模拟请求Python库。
    • VCR.py-记录并重放测试中的HTTP交互。
  • 对象工厂
    • factory_boy -Python的测试装置替代品。
    • mixer-另一种灯具更换。支持Django,Flask,SQLAlchemy,Peewee等
    • model_mommy-创建随机夹具以在Django中进行测试。
  • 代码覆盖率
  • 伪数据
    • fake2db-伪数据库生成器。
    • faker-一个生成伪造数据的Python包。
    • mimesis-是一个Python库,可帮助您生成虚假数据。
    • radar -生成随机的日期时间/时间。

用于验证数据的库。


十、web框架

传统的全栈Web框架。另请参阅RESTful API


十一、搜索

用于对数据建立索引并执行搜索查询的库和软件。


十二、日志记录

用于生成和使用日志的库。

  • logbook - -记录Python的替换记录。
  • logging-(Python标准库)Python的日志记录工具。
  • loguru-旨在以Python带来令人愉悦的日志记录的库。
  • sentry- python-适用于Python的Sentry SDK。
  • structlog-结构化日志变得容易。

十三、并发与并行

用于并发和并行执行的库。另请参阅awesome-asyncio


十四、任务队列

用于处理任务队列的库。

  • celery-基于分布式消息传递的异步任务队列/作业队列。
  • Dramatiq-用于Python 3的快速可靠的后台任务处理库。
  • huey-小多线程任务队列。
  • mrq-使用Redis和gevent的Python中的分布式工作者任务队列。
  • rq -Python的简单作业队列。

十五、自然语言处理

用于使用人类语言的图书馆。

  • 一般的
    • gensim-人类主题建模。
    • langid.py-独立的语言识别系统。
    • nltk-用于构建Python程序以使用人类语言数据的领先平台。
    • pattern-一个Web挖掘模块。
    • polyglot-支持数百种语言的自然语言管道。
    • pytext的-基于PyTorch自然语言建模框架。
    • PyTorch-NLP-一种工具包,可用于研究的快速深度学习NLP原型。
    • spacy -一种用于Python和用Cython工业强度的自然语言处理库。
    • Stanza -Stanford NLP Group的官方Python库,支持60多种语言。
  • 中国人
    • funNLP-中国NLP的工具和数据集的集合。
    • jieba-最受欢迎的中文文本分割库。
    • pkuseg-python-用于各种领域的中文分词的工具包。
    • snownlp-用于处理中文文本的库。

十六、深度学习、机器学习计算机视觉

神经网络和深度学习框架。另请参阅真棒深度学习

  • caffe-深度学习的快速开放框架。
  • keras-一个高级神经网络库,能够在TensorFlow或Theano之上运行。
  • mxnet-专为效率和灵活性而设计的深度学习框架。
  • pytorch-具有强大GPU加速功能的Python中的张量和动态神经网络。
  • SerpentAI-游戏代理框架。使用任何视频游戏作为深度学习沙箱。
  • tensorflow-由Google创建的最受欢迎的深度学习框架。
  • Theano-一个用于快速数值计算的库。

机器学习图书馆。另请参阅很棒的机器学习

  • 健身房-用于开发和比较强化学习算法的工具包。
  • H2O-开源快速可扩展机器学习平台。
  • 指标-机器学习评估指标。
  • NuPIC -Numenta智能计算平台。
  • scikit-learn-最受欢迎的机器学习Python库。
  • Spark ML - Apache Spark的可扩展机器学习库。
  • vowpal_porpoise-用于Vowpal Wabbit的轻量级Python包装器。
  • xgboost-一个可扩展,可移植和分布式的梯度增强库。
  • MindsDB -MindsDB是现有数据库的开源AI层,可让您使用标准查询轻松地开发,训练和部署最新的机器学习模型。

计算机视觉图书馆。


十七、数据分析、可视化

用于数据分析的库。

  • AWS Data Wrangler -AWS上的Pandas。
  • Blaze -NumPy和Pandas连接到大数据。
  • Pandas界面中的Open Mining-商业智能(BI)。
  • Optimus –敏捷数据科学的工作流程变得容易与PySpark。
  • Orange –通过可视化编程或脚本进行数据挖掘,数据可视化,分析和机器学习。
  • Pandas-一个提供高性能,易于使用的数据结构和数据分析工具的库。

用于可视化数据的库。另请参阅awesome-javascript

  • Altair-用于Python的声明性统计可视化库。
  • Bokeh-用于Python的交互式Web绘图。
  • bqplot -Jupyter Notebook的交互式绘图库
  • Cartopy-具有matplotlib支持的制图python库
  • 短跑-建立在烧瓶顶部,反应,Plotly旨在分析Web应用程序。
  • 图表-图表为代码。
  • Matplotlib-一个Python 2D绘图库。
  • plotnine-基于ggplot2的Python图形语法。
  • Pygal-一个Python SVG图表创建器。
  • PyGraphviz - Graphviz的Python接口。
  • PyQtGraph-交互式和实时2D / 3D /图像绘制以及科学/工程小部件。
  • Seaborn -使用Matplotlib统计数据可视化。
  • VisPy-基于OpenGL的高性能科学可视化。

十八、数据库驱动程序

用于连接和操作数据库的库。


十九、DevOps工具

DevOps的软件和库。

  • 配置管理
    • ansible-一个非常简单的IT自动化平台。
    • cloudinit-一个多分发包,用于处理云实例的早期初始化。
    • OpenStack-用于构建私有和公共云的开源软件。
    • pyinfra-通用的CLI工具和python库,可自动执行基础架构。
    • saltstack-基础结构自动化和管理系统。
  • SSH样式的部署
    • cuisine -类似于Fabric的厨师功能。
    • fabric -一个简单的,Python化工具,用于远程执行和部署。
    • fabtools-编写很棒的Fabric文件的工具。
  • 流程管理
    • honcho - Foreman的Python克隆,用于管理基于Procfile的应用程序。
    • supervisor -用于UNIX监事过程控制系统。
  • 监控方式
    • psutil-跨平台的流程和系统实用程序模块。
  • 后备
    • BorgBackup-具有压缩和加密功能的重复数据删除存档器。
  • 其他

二十、分布式计算

分布式计算的框架和库。

  • 批量处理
    • dask-用于分析计算的灵活并行计算库。
    • luigi-一个模块,可帮助您构建批处理作业的复杂管道。
    • mrjob-在Hadoop或Amazon Web Services上运行MapReduce作业。
    • PySpark - Apache Spark Python API。
    • Ray-用于并行和分布式Python的系统,统一了机器学习生态系统。
  • 流处理

二十一、配置、打包构建

用于存储和解析配置选项的库。

  • configobj-带有验证的INI文件解析器。
  • configparser-(Python标准库)INI文件解析器。
  • hydra -Hydra是用于优雅配置复杂应用程序的框架。
  • profig-使用值转换从多种格式进行配置。
  • python-decouple-严格将设置与代码分开。

用于创建打包的可执行文件以进行发行的库。

  • dh-virtualenv-以Debian软件包的形式构建和分发virtualenv。
  • Nuitka-将脚本,模块,程序包编译为可执行文件或扩展模块。
  • py2app-冻结Python脚本(Mac OS X)。
  • py2exe-冻结Python脚本(Windows)。
  • pyarmor-一种用于混淆python脚本,将混淆后的脚本绑定到固定计算机或使混淆后的脚本失效的工具。
  • PyInstaller-将Python程序转换为独立的可执行文件(跨平台)。
  • pynsist-用于构建Windows安装程序的工具,安装程序将Python本身捆绑在一起。
  • shiv-命令行实用程序,用于构建完全独立的zipapp(PEP 441),但包括其所有依赖项。

二十二、虚拟环境

用于Python版本和虚拟环境管理的库。

  • pyenv-简单的Python版本管理。
  • virtualenv-创建隔离的Python环境的工具。

二十三、界面开发

用于处理图形用户界面应用程序的库。

  • curses - -内置包装器ncurses的用于创建终端GUI的应用程序。
  • Eel-一个用于制作简单的类似于电子的脱机HTML / JS GUI应用程序的库。
  • enaml-使用声明性语法(如QML)创建漂亮的用户界面。
  • Flexx -Flexx是用于创建GUI的纯Python工具包,它使用Web技术进行呈现。
  • Gooey-使用命令行将命令行程序转换为完整的GUI应用程序。
  • kivy-用于创建NUI应用程序的库,可在Windows,Linux,Mac OS X,Android和iOS上运行。
  • pyglet -Python的跨平台窗口和多媒体库。
  • PyGObject -GLib / GObject / GIO / GTK +(GTK + 3)的Python绑定。
  • PyQt - Qt跨平台应用程序和UI框架的Python绑定。
  • PySimpleGUI - tkinter,Qt,WxPython和Remi的包装。
  • pywebview-围绕webview组件的轻量级跨平台本机包装器。
  • Tkinter -Tkinter是Python的事实上的标准GUI软件包。
  • Toga -Python本机,OS本机GUI工具箱。
  • urwid-一个用于创建终端GUI应用程序的库,该库对小部件,事件,丰富的颜色等具有强大的支持。
  • wxPython -wxWidgets C ++类库与Python的混合。
  • DearPyGui-一个简单的GPU加速的Python GUI框架

二十四、游戏开发

很棒的游戏开发库。

  • Arcade -Arcade是一个现代Python框架,用于制作具有引人注目的图形和声音的游戏。
  • Cocos2d -cocos2d是用于构建2D游戏,演示和其他图形/交互应用程序的框架。
  • Harfang3D-用于3D,VR和游戏开发的Python框架。
  • Panda3D-迪士尼开发的3D游戏引擎。
  • Pygame -Pygame是一组旨在编写游戏的Python模块。
  • PyOgre -Ogre 3D渲染引擎的Python绑定,可用于游戏,模拟或任何3D。
  • PyOpenGL -OpenGL及其相关API的Python ctypes绑定。
  • PySDL2 -SDL2库的基于ctypes的包装器。
  • RenPy-一个视觉小说引擎

二十五、任务调度器

用于计划作业的库。

  • Airflow 气流是一个以编程方式编写,安排和监视工作流的平台。
  • APScheduler-轻巧但功能强大的进程内任务计划程序,可让您计划功能。
  • django-schedule -Django的日历应用程序。
  • doit-一个任务运行器和构建工具。
  • gunnery -具有基于Web界面的分布式系统的多用途任务执行工具。
  • Joblib-一套在Python中提供轻量级流水线的工具。
  • Plan -像用吊饰一样用Python编写crontab文件。
  • Prefect-一个现代的工作流程编排框架,可轻松构建,调度和监视强大的数据管道。
  • schedule-针对人类的Python作业调度。
  • Spiff-用纯Python实现的功能强大的工作流引擎。
  • TaskFlow-一个Python库,可帮助简化,一致且可靠的任务执行

二十六、科学计算

用于科学计算的图书馆。另请参见Python for-Scientists

  • astropy-天文学的社区Python库。
  • bcbio-nextgen-提供最佳实践流水线,用于全自动高通量测序分析。
  • bccb-收集与生物学分析有关的有用代码。
  • Biopython -Biopython是一套免费的生物计算工具。
  • cclib-一个用于解析和解释计算化学程序包结果的库。
  • Colour -实施大量的颜色理论转换和算法。
  • Karate Club -用于图形结构化数据的无监督机器学习工具箱。
  • NetworkX-用于复杂网络的高生产率软件。
  • NIPY-神经影像工具箱的集合。
  • NumPy-使用Python进行科学计算的基本软件包。
  • ObsPy-地震学的Python工具箱。
  • Open Babel-一种化学工具箱,旨在讲多种化学数据语言。
  • PyDy -Python Dynamics的缩写,用于协助工作流进行动态运动建模。
  • PyMC-马尔可夫链蒙特卡洛采样工具包。
  • QuTiP -Python中的Quantum Toolbox。
  • RDKit-化学信息学和机器学习软件。
  • SciPy-用于数学,科学和工程的基于Python的开源软件生态系统。
  • SimPy-一个基于过程的离散事件模拟框架。
  • statsmodels -Python中的统计建模和计量经济学。
  • SymPy-一个用于符号数学的Python库。
  • Zipline-一个Pythonic算法交易库。

RPC

RPC兼容服务器。


整理了下github的资源,供大家参考。

有一起学Python的小伙伴别忘记加入我们的Python学习交流群群:367203382

本作品采用《CC 协议》,转载必须注明作者和本文链接
本帖由系统于 4个月前 自动加精
讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!
未填写
文章
1
粉丝
2
喜欢
8
收藏
16
排名:2128
访问:230
私信
所有博文