<pre id="lq0nf"><label id="lq0nf"></label></pre>
<td id="lq0nf"><strike id="lq0nf"></strike></td>
  • <object id="lq0nf"><meter id="lq0nf"></meter></object>
    <object id="lq0nf"><nav id="lq0nf"><noframes id="lq0nf">
  • <pre id="lq0nf"><label id="lq0nf"></label></pre>
    1. 侵权投诉

      数据分析中最常用、最好用的20个Python库分享

      电子设计 ? 2021-01-03 09:28 ? 次阅读

      【导读】Python在解决数据科学任务和挑战方面处于领先地位。而一些方便易用的库则帮助了开发人员高效开发。在这里我们整理了20个在深度学习、数据分析中最常用、最好用的Python库,供大家一起学习。

      作者| ActiveWizards

      编译|专知

      整理|Yingying,李大囧

      核心库与统计

      NumPy

      我们从科学应用程序库开始说起,NumPy是该领域的主要软件包之一。 它旨在处理大型多维数组和矩阵,并且广泛的高级数学函数和实现的方法集合,使得可以使用这些对象执行各种操作。

      在这一年中,NumPy有很多更新。 除了错误修复和兼容性问题之外,关键更新还包括NumPy对象的打印格式。此外,某些函数现在可以处理Python中可用的任何编码的文件。

      SciPy

      另一个科学计算核心库是SciPy。它基于NumPy,并扩展了其功能。 SciPy主数据结构又是一个多维数组,由Numpy实现。该软件包包含有助于解决线性代数,概率论,积分计算和更多任务的工具。

      SciPy可以适配不同的操作系统。这一年,Scipy带来了许多函数的更新,尤其是优化器也更新了。此外,封装了许多新的BLAS和LAPACK函数。

      Pandas

      Pandas提供了高级数据结构和各种分析工具。该软件包的一大特色是能够将相当复杂的数据操作转换为一个或两个命令。 Pandas包含许多用于分组,过滤和组合数据的内置方法,以及时间序列功能。

      Pandas在这一年的更新包括数百个新功能,bug修复和API的更改。

      StatsModels

      Statsmodels是一个统用于统计数据分析的方法,例如统计模型估计,执行统计测试等。在它的帮助下,您可以实现许多机器学习方法。

      这个库在不停的更新。今年带来了时间序列改进和新的计数模型,即GeneralizedPoisson,零膨胀模型和NegativeBinomialP,以及新的多变量方法 - 因子分析,MANOVA和ANOVA中的重复测量。

      可视化

      Matplotlib

      Matplotlib是一个用于创建二维图表和图形的低级库。 借助它的帮助,您可以构建各种图表,从直方图和散点图到非笛卡尔坐标图。 此外,许多流行的绘图库被设计为与matplotlib一起使用。

      颜色,尺寸,字体,图例的样式等都有变化。比如轴图例的自动对齐,和更友好的配色。

      pIYBAF9uKKOAZAQaAAEltPVFels346.png

      Seaborn

      Seaborn本质上是基于matplotlib库的更高级别的API。 它包含有丰富的可视化图库,包括时间序列,联合图和小提琴图(展示数据密度分布)等复杂类型。

      seaborn更新主要包括bug修复。 此外,FacetGrid或PairGrid与增强的交互式matplotlib后端之间的兼容性有所改进,为可视化添加了参数和选项。

      o4YBAF9uKKWAJTbuAAFnnWiR5ak704.png

      Plotly

      Plotly是一个流行的库,可以让您轻松地构建复杂的图形。 该软件包适用于交互式Web应用程序。 其可视化效果包括轮廓图形,三元图和3D图表。

      今年该库的更新包括对“多链接视图”以及动画和串扰集成的支持。

      Bokeh

      Bokeh库使用JavaScript小部件在浏览器中创建交互式和可伸缩的可视化。 该库提供了多种图形,样式及链接图形式的交互能力,定义回调以及更多有用的功能。

      Bokeh可以提供改进的交互式功能,例如分类刻度标签的旋转,以及小缩放工具和自定义工具提示字段增强功能。

      pIYBAF9uKKiADl8nAAJgUugR2a8987.png

      Pydot

      Pydot是Graphviz的一个接口,用纯Python编写。 在它的帮助下,可以显示图形的结构,这在构建神经网络和基于决策树的算法时会经常用到。

      pIYBAF9uKKuASmz2AAGODhkEbXg177.png

      机器学习

      Scikit-learn

      这个基于NumPy和SciPy的Python??槭谴硎莸淖罴芽庵?。它为许多标准机器学习和数据挖掘任务提供算法,例如聚类,回归,分类,降维和模型选择。

      今年这个库的更新包括:修改交叉验证,提供了使用多个指标的功能;最近邻和逻辑回归等几种训练方法有一些小的改进。

      XGBoost / LightGBM / CatBoost

      Boosting是最流行的机器学习算法之一,其在于构建基本模型的集合,即决策树。因此,有专门的库设计用于快速方便地实现该方法。XGBoost,LightGBM和CatBoost值得特别关注。这些库提供高度优化,可扩展和快速的梯度增强实现,这使得它们在数据科学家和Kaggle竞赛中非常受欢迎。

      Eli5

      通常,机器学习模型预测的结果并不完全清楚,而eli5库有助与解决问题。它是一个可视化调试机器学习模型的包,并逐步跟踪算法的工作过程。它可与scikit-learn,XGBoost,LightGBM,lightning和sklearn-crfsuite库兼容。

      深度学习

      TensorFlow

      TensorFlow是一个流行的深度和机器学习框架,由Google Brain开发。它提供了使用具有多个数据集的人工神经网络的能力。最受欢迎的TensorFlow应用包括对象识别,语音识别等。

      这个库在新版本中很快,引入了新功能和新功能。最新的修复包括潜在的安全漏洞和改进的TensorFlow和GPU集成,例如您可以在一台计算机上的多个GPU上运行Estimator模型。

      PyTorch

      PyTorch是一个大型框架,允许使用GPU加速执行张量计算,创建动态计算图并自动计算梯度。在此之上,PyTorch提供了丰富的API,用于解决与神经网络相关的应用。

      该库基于Torch,这是一个用C语言实现的开源深度学习库,在Lua中有一个包装器。 Python API于2017年推出,从那时起,该框架越来越受欢迎并吸引了越来越多的数据科学家。

      Keras

      Keras是一个用于处理神经网络的高级库,运行在TensorFlow,Theano之上。现在它也可以使用CNTK和MxNet作为后端。它简化了许多特定任务,并大大减少了单调代码的数量。但是,它可能不适合某些复杂的事情。

      该库在性能,可用性,文档和API都有一定改进。一些新功能是Conv3DTranspose层,新的MobileNet应用程序和自我规范化网络。

      分布式深度学习

      Dist-keras / elephas / spark-deep-learning

      使用像Apache Spark这样的分布式计算系统可以更轻松地处理如此大量的数据,这再次扩展了深度学习的可能性。因此,dist-keras,elephas和spark-deep-learning正在迅速发展。这些软件包可以在Apache Spark的帮助下直接基于Keras库训练神经网络。 Spark-deep-learning还提供了使用Python神经网络创建管道的工具。

      自然语言处理

      NLTK

      NLTK是一组库,是自然语言处理的完整平台。 在NLTK的帮助下,您可以通过各种方式处理和分析文本,标记文本,提取信息等。NLTK还用于原型设计和构建研究系统。

      这个库的附魔包括API和兼容性的微小变化以及CoreNLP的新界面。

      SpaCy

      SpaCy是一个自然语言处理库,包含优秀的demo,API文档和演示应用程序。该库是用Cython语言编写的,它是Python的C扩展。它支持近30种语言,提供简单的深度学习集成,并保证了稳健性和高准确性。 SpaCy的另一个重要特性它是为整个文档处理而设计的,而不会将文档分成短语。

      Gensim

      Gensim是一个用于强大语义分析,主题建模和向量空间建模的Python库,基于Numpy和Scipy构建。它提供了流行的NLP算法的实现,例如word2vec。

      数据抓取

      Scrapy

      Scrapy是一个用于创建扫描网站页面和收集结构化数据的爬虫库。此外,Scrapy可以从API中提取数据。由于其可扩展性和可移植性,该库恰好非常方便。

      结论
      与去年相比,一些新的库越来越受欢迎,而那些已成为数据科学任务经典库正在不断改进。

      表格中列出了这些库的github活动的详细统计信息。

      o4YBAF9uKK-AYCGJAAOx6nNMTIY255.png

      编辑:hfy


      收藏 人收藏
      分享:

      评论

      相关推荐

      电子行业B2B数字化升级, 腾采通先行
      以往,在数以亿计的电子元器件中快速找到想要的型号,如同大海捞针一般。直到一款B2B交易型SaaS(S....
      发表于 10-15 15:49 ? 8次 阅读
      电子行业B2B数字化升级, 腾采通先行
      关于Python18个你不知道的高效编程技巧
      初识Python语言,觉得python满足了我上学时候对编程语言的所有要求。python语言的高效编....
      的头像 马哥Linux运维 发表于 10-15 11:23 ? 114次 阅读
      用Python实现3D地图教程
      前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题....
      的头像 马哥Linux运维 发表于 10-13 10:09 ? 122次 阅读
      用Python实现3D地图教程
      大联大世平集团推出基于Intel与Orbit产品的车牌识别解决方案
      大联大控股宣布,其旗下世平推出基于英特尔(Intel)Movidius与律碁(Orbit)AiCam....
      发表于 10-13 09:55 ? 794次 阅读
      大联大世平集团推出基于Intel与Orbit产品的车牌识别解决方案
      关于Python对交通路口的红绿灯进行颜色检测
      转自?|?? Python联盟 1.视频读取 首先把视频读取进来,因为我测试的视频是4k的所以我用r....
      的头像 新机器视觉 发表于 10-13 09:32 ? 158次 阅读
      关于Python对交通路口的红绿灯进行颜色检测
      Deep Edge AI使得算法的规模正不断缩小
      机器学习和深度学习网络有可能通过提供更强大的全新方法来分析现场数据,从而极大地提高产品价值。Deep....
      的头像 STM32单片机 发表于 10-12 17:36 ? 123次 阅读
      如何制作数据可视化大屏
      经常有小伙伴问,如何制作数据可视化大屏? 今天将手把手带你爬取奥运会相关信息,并利用 可视化大屏 为....
      的头像 Linux爱好者 发表于 10-12 16:31 ? 112次 阅读
      如何制作数据可视化大屏
      什么是MicroPython 它能做什么有什么局限
      随着Python成为主流的编程语言,MicroPython在嵌入式系统领域也越来越热门起来,尤其是大....
      的头像 电子森林 发表于 10-12 11:44 ? 199次 阅读
      10具有挑战性的Python项目创意
      你知道 Python 是被称为 全能编程语言 的吗?是的,它确实是,虽然不应该在每个项目中都使用它。....
      的头像 Android编程精选 发表于 10-12 10:43 ? 208次 阅读
      如何把Python和Excel两大数据工具进行集成
      ? 这次我们会介绍如何使用xlwings将Python和Excel两大数据工具进行集成,更便捷地处理....
      的头像 数据分析与开发 发表于 10-12 09:41 ? 127次 阅读
      如何把Python和Excel两大数据工具进行集成
      如何在Colab中使用SQL
      如今,编码测试在数据科学面试过程中几乎是标准的。 作为一名数据科学招聘经理,我发现一个20-30分钟....
      的头像 智能感知与物联网技术研究所 发表于 10-12 09:39 ? 138次 阅读
      如何在Colab中使用SQL
      Python开发中Pycharm的实用小技巧
      ? Pycharm作为Python开发最常用的IDE之一,不仅兼容性好,而且功能也相当丰富,比如调试....
      的头像 马哥Linux运维 发表于 10-12 09:36 ? 116次 阅读
      Python的时间处理??橹写砣掌谟胧奔涞娜孀芙?/a>
      Python的时间处理??樵谌粘5氖褂弥杏玫慕隙?,但是使用的时候基本上都是要查资料,还是有些麻烦的,....
      的头像 马哥Linux运维 发表于 10-12 09:24 ? 154次 阅读
      Python的时间处理??橹写砣掌谟胧奔涞娜孀芙? />    </a>
</div><div class= Python中最常用的几种线程锁你会用吗
      前言本文将继续围绕 threading ??榻步?,基本上是纯理论偏多。 对于日??⒄呃唇埠苌倩崾褂?...
      的头像 马哥Linux运维 发表于 10-11 16:07 ? 131次 阅读
      优秀的 Verilog/FPGA开源项目介绍(一)
      优秀的 Verilog/FPGA开源项目介绍(一)-PCIe通信 今天开始会陆续介绍一些优秀的开源项....
      的头像 OpenFPGA 发表于 10-11 15:31 ? 214次 阅读
      优秀的 Verilog/FPGA开源项目介绍(一)
      Python入门知识汇总
      Python代码生成EXE文件的方法是什么?
      发表于 10-11 06:00 ? 0次 阅读
      Python版test1实战说明
      上一篇文章已经带着大家安装 DeepStream 的 Python 开发环境,并且执行最简单的 de....
      的头像 NVIDIA英伟达企业解决方案 发表于 10-09 14:28 ? 138次 阅读
      Cerebras能否超越英伟达GPU算力
      深度学习已经成为我们这一代人最重要的计算工作量之一,推进从视觉识别到自动驾驶的跨行业应用。但这也是深....
      发表于 10-09 14:26 ? 19次 阅读
      教你们如何用 Python 快速制作海报级地图附代码
      ?1 简介 基于 Python 中诸如 matplotlib 等功能丰富、自由度极高的绘图库,我们可....
      的头像 Linux爱好者 发表于 10-09 11:36 ? 245次 阅读
      什么是Python中的流程控制?
      什么是Python中的流程控制?
      发表于 10-09 07:24 ? 0次 阅读
      Python定时任务的实现方式
      在日常工作中,我们常?;嵊玫叫枰芷谛灾葱械娜挝?,一种方式是采用 Linux 系统自带的 crond....
      的头像 马哥Linux运维 发表于 10-08 15:20 ? 1184次 阅读
      Python的矩阵传播机制
      一、Python的矩阵传播机制(Broadcasting) 我们知道在深度学习中经常要操作各种矩阵(....
      的头像 Linux爱好者 发表于 09-30 16:53 ? 284次 阅读
      用于检测异常的胸部X光图像的深度学习系统
      在医学成像中应用机器学习 (ML),为改善胸部 X 光 (CXR) 图像解读的可用性、延迟时间、准确....
      的头像 TensorFlow 发表于 09-30 11:16 ? 367次 阅读
      Python提供了几个级别访问的网络服务呢
      Python提供了几个级别访问的网络服务呢?
      发表于 09-30 08:09 ? 0次 阅读
      如何用python实现贪吃蛇游戏
      贪吃蛇 具体实现部分,大致分为三个??槔唇樯埽河蜗烦跏蓟?、游戏运行(蛇移动、吃掉食物)、游戏结束 1....
      的头像 马哥Linux运维 发表于 09-29 18:05 ? 447次 阅读
      如何用python实现贪吃蛇游戏
      贝壳/皮革大理石深度学习检测案例
      通过系统使用人工智能技术,通过深度学习算法、数据训练不断优化,提高识别效果,结合工业相机,控制技术实....
      发表于 09-29 18:05 ? 29次 阅读
      借助深度学习算法实现5秒内克隆你的声音
      大家应该都知道声音克隆技术,通俗的来说就是借助深度学习算法,可以完全模拟某个人的声音,而且由机器合成....
      的头像 Android编程精选 发表于 09-29 11:45 ? 302次 阅读
      python导出excel格式的oracle数据报表讲解
      python导出excel格式的oracle数据报表讲解(通信电源技术期刊官网)-该文档为pytho....
      发表于 09-28 13:10 ? 18次 阅读
      python导出excel格式的oracle数据报表讲解
      MathWorks发布MATLAB和Simulink版本 2021b
      MathWorks 于今日发布 MATLAB 和 Simulink 产品系列版本 2021b。版本 ....
      发表于 09-28 11:23 ? 1133次 阅读
      MathWorks发布MATLAB和Simulink版本 2021b
      在鸿蒙上使用Python进行物联网编程
      在上一篇帖子《使用 Python 开发鸿蒙设备程序(1-GPIO 外设控制)》中,已经成功的使用 P....
      的头像 HarmonyOS技术社区 发表于 09-28 09:55 ? 424次 阅读
      在鸿蒙上使用Python进行物联网编程
      安谋科技再获世界互联网大会领先科技成果奖
      世界互联网领先科技成果发布活动”自2016年起已成功举办了五届, 成为了全球互联网领域的科技盛宴。
      发表于 09-28 09:51 ? 1004次 阅读
      安谋科技再获世界互联网大会领先科技成果奖
      怎样去实现一种基于Python的OPC UA编程
      怎样去实现一种基于Python的OPC UA编程? 如何通过FreeOpcUa创建自己的地址空间? ...
      发表于 09-28 09:35 ? 0次 阅读
      用Python完成鸿蒙开发板外设控制
      话说很久以前,我将 MicroPython 的解释器给“挖”了出来,然后做了适配,成功运行于鸿蒙设备....
      的头像 HarmonyOS技术社区 发表于 09-28 09:22 ? 319次 阅读
      模型量化会带来哪些好处?
      量化算法具有什么特点? 模型量化会带来哪些好处? ...
      发表于 09-28 06:32 ? 0次 阅读
      请问如何选择合适机械的伺服电机?
      请问如何选择合适机械的伺服电机?
      发表于 09-27 07:57 ? 0次 阅读
      pandas筛选数据的8个小技巧
      ? 日常用 Python 做数据分析最常用到的就是查询筛选了,按各种条件、各种维度以及组合挑出我们想....
      的头像 数据分析与开发 发表于 09-26 11:04 ? 1048次 阅读
      pandas筛选数据的8个小技巧
      Python连接Oracle数据库
      Python连接Oracle数据库(深圳市核达中远通电源技术股份有限公司招聘)-该文档为Python....
      发表于 09-24 17:20 ? 27次 阅读
      Python连接Oracle数据库
      深刻理解Python中的元类(metaclass)
      深刻理解Python中的元类(metaclass)(大工20春电源技术在线作业2)-该文档为深刻理解....
      发表于 09-24 16:12 ? 22次 阅读
      深刻理解Python中的元类(metaclass)
      分享Python 流畅的Python
      目录: 第一部分 序幕 第 1 章 Python 数据模型 1.1 一摞Python风格的纸牌 1.2 如何使用特殊方法 1.2.1 模拟数值...
      发表于 09-23 20:39 ? 606次 阅读
      分享Python 流畅的Python
      Python后端项目的协程是什么
      最近公司 Python 后端项目进行重构,整个后端逻辑基本都变更为采用“异步”协程的方式实现??醋怕?...
      的头像 Linux爱好者 发表于 09-23 14:38 ? 262次 阅读
      Python中三个json组件的安装方式
      在 Python 使用用 json.dumps(data) 时突然发现特别慢,data 本身不大,但....
      的头像 马哥Linux运维 发表于 09-23 14:35 ? 268次 阅读
      Python中三个json组件的安装方式
      瑞萨电子加速面向ADAS和自动驾驶应用的深度学习开发
      全新R-Car SDK为车规级计算机视觉和AI功能而打造,且经过优化,可与瑞萨前沿R-Car V3H....
      发表于 09-22 11:16 ? 1039次 阅读
      瑞萨电子加速面向ADAS和自动驾驶应用的深度学习开发
      如何利用Python语言来控制电机
      如何利用Python语言来控制电机? 如何利用L298N驱动板来控制电机? ...
      发表于 09-22 08:32 ? 0次 阅读
      初学者如何去选择一种编程语言
      Python是什么?JavaScript有何优点? 对于初学者什么是最好的编程语言?...
      发表于 09-22 06:26 ? 0次 阅读
      自然语言处理主要有哪些应用
      1、机器翻译,2、信息检索,3、自动问答,除此之外,情感分析、自动文本摘要、社会计算和信息抽取也都有....
      的头像 西西 发表于 09-21 15:55 ? 140次 阅读
      自然语言处理主要有哪些应用
      在Anaconda中安装python包seaborn
      在Anaconda中安装python包seaborn(现代电源技术题库)-在Anaconda中安装p....
      发表于 09-18 15:01 ? 29次 阅读
      在Anaconda中安装python包seaborn
      Python科学计算利器Anaconda
      Python科学计算利器Anaconda(开关电源技术毕业设计)-Python科学计算利器Anaco....
      发表于 09-18 14:26 ? 30次 阅读
      Python科学计算利器Anaconda
      Python主要有哪几大应用领域
      Python是什么?Python的特点是什么? Python有哪些应用领域? ...
      发表于 09-18 06:19 ? 0次 阅读
      如何使用工业树莓派做ython的PWM控制
      虹科工业树莓派 准备工作 硬件: 虹科工业树莓派1台 DIO???个 Windows系统电脑1台 L....
      的头像 广州虹科电子科技有限公司 发表于 09-16 10:57 ? 1898次 阅读
      如何使用工业树莓派做ython的PWM控制
      基于Python-casacore的射电测量集文件生成方法
      基于Python-casacore的射电测量集文件生成方法(开关电源技术试卷)-该文档为基于Pyth....
      发表于 09-15 13:11 ? 33次 阅读
      基于Python-casacore的射电测量集文件生成方法
      符合IEPE标准的CbM机器学习赋能平台
      CbM需要捕获全带宽数据,以确保时域和频域中的所有谐波、混叠及其他机械相互作用都得到考虑。这种数据收....
      发表于 09-13 12:45 ? 3912次 阅读
      符合IEPE标准的CbM机器学习赋能平台
      如何通过Python脚本实现WIFI密码的暴力破解
      前言 本文将记录学习下如何通过 Python 脚本实现 WIFI 密码的暴力破解,从而实现免费蹭网。....
      的头像 马哥Linux运维 发表于 09-10 17:09 ? 666次 阅读
      如何通过Python脚本实现WIFI密码的暴力破解
      如何在环境安装使用Python操作word
      作者丨超级大洋葱806 https://tangxing.blog.csdn.net/article....
      的头像 Android编程精选 发表于 09-05 15:13 ? 513次 阅读
      如何在环境安装使用Python操作word
      如何利用Python抓取用户发的话题
      大多数APP里面返回的是json格式数据,或者一堆加密过的数据 。这里以超级课程表APP为例,抓取超....
      的头像 马哥Linux运维 发表于 09-05 09:37 ? 282次 阅读
      如何利用Python抓取用户发的话题
      恩智浦与地平线达成战略合作,联合开发预集成、量产级解决方案
      恩智浦是全球领先的汽车电子解决方案供应商,为安全互联汽车提供全面的系统级解决方案。恩智浦S32G高性....
      发表于 09-02 15:47 ? 325次 阅读
      恩智浦与地平线达成战略合作,联合开发预集成、量产级解决方案
      北鲲云超算平台在AlphaFold2的应用
      受人工智能和深度学习技术发展较快等因素影响,结构生物学数据的研究也开始迎来了崭新的阶段,针对蛋白质结....
      发表于 09-02 10:26 ? 80次 阅读
      分享一个最新的的Python对象序列化方式
      许多Python标准库都有一些未被赏识的精华。其中之一是允许简单优雅的基于参数类型的函数分发。这一特....
      的头像 马哥Linux运维 发表于 09-01 15:19 ? 984次 阅读
      分享一个最新的的Python对象序列化方式
      jsonpath库中的常规功能介绍
      1 简介 在日常使用Python的过程中,我们经?;嵊雑son格式的数据打交道,尤其是那种嵌套结构复....
      的头像 Linux爱好者 发表于 09-01 14:11 ? 261次 阅读
      jsonpath库中的常规功能介绍
      Python 代码加速运行的的小技巧
      Python 是一种脚本语言,相比 C/C++ 这样的编译语言,在效率和性能方面存在一些不足。但是,....
      的头像 Android编程精选 发表于 09-01 11:28 ? 342次 阅读
      亚洲色欧美图另类综合_亚洲 自拍 色综合图区av网站_亚洲人成伊人成综合网 临清市| 榆树市| 延庆县| 丰都县| 浦北县| 宽甸| 呼玛县| 灌云县| 鄢陵县| 贵定县| 庆城县| 秦皇岛市| 孟村| 济阳县| 图木舒克市| 钟山县| 安吉县| 双江| 辉县市| 科尔| 渭南市| 高淳县| 玛曲县| 宁武县| 商城县| 南充市| 青铜峡市| 海城市| 宜春市| 台前县| 游戏| 龙陵县| 榆树市| 荣昌县| 华容县| 扶沟县| 大理市| 凌海市| 广饶县| 公安县| 武胜县| http://444 http://444 http://444 http://444 http://444 http://444