当前位置: 首页 > news >正文

asp艺术学校网站源码济南seo外包服务

asp艺术学校网站源码,济南seo外包服务,摄影网站建设目的,内蒙古政府网站建设 论文SQL和Python几乎是当前数据分析师必须要了解的两门语言,它们在处理数据时有什么区别?本文将分别用MySQL和pandas来展示七个在数据分析中常用的操作,希望可以帮助掌握其中一种语言的读者快速了解另一种方法!(文末也有给…

SQL和Python几乎是当前数据分析师必须要了解的两门语言,它们在处理数据时有什么区别?本文将分别用MySQL和pandas来展示七个在数据分析中常用的操作,希望可以帮助掌握其中一种语言的读者快速了解另一种方法(文末也有给大家整理两种方法的视频教程,大家按需学习就好)

 

一、选择

在SQL中,我们可以使用SELECT语句从表选择数据,结果被存储在一个结果表中,语法如下:

SELECT column_name,column_name
FROM table_name;

如果不想显示全部的记录,可以使用TOP或LIMIT来限制行数。因此选择tips表中的部分列可以使用下面的语句

SELECT total_bill, tip, smoker, time
FROM tips
LIMIT 5;

入门数据分析选择Python还是SQL?七个常用操作对比

 

而在pandas中,我们可以通过将列名列表传递给DataFrame来完成列选择

入门数据分析选择Python还是SQL?七个常用操作对比

 

在SQL中,进行选择的同时还可以进行计算,比如添加一列

SELECT *, tip/total_bill as tip_rate
FROM tips
LIMIT 5;

入门数据分析选择Python还是SQL?七个常用操作对比

 

在pandas中使用DataFrame.assign()同样可以完成这个操作

入门数据分析选择Python还是SQL?七个常用操作对比

 

二、查找

单条件查找

在SQL中,WHERE子句用于提取那些满足指定条件的记录,语法如下

SELECT column_name,column_name
FROM table_name
WHERE column_name operator value;

比如查找示例数据中time = dinner的记录

SELECT *
FROM tips
WHERE time = 'Dinner'
LIMIT 5;

入门数据分析选择Python还是SQL?七个常用操作对比

 

而在pandas中,按照条件进行查找则可以有多种形式,比如可以将含有True/False的Series对象传递给DataFrame,并返回所有带有True的行

入门数据分析选择Python还是SQL?七个常用操作对比

 

多条件查找

在SQL中,进行多条件查找可以使用AND/OR来完成

SELECT *
FROM tips
WHERE time = 'Dinner' AND tip > 5.00;

入门数据分析选择Python还是SQL?七个常用操作对比

 

在pandas中也有类似的操作

入门数据分析选择Python还是SQL?七个常用操作对比

 

查找空值

在pandas检查空值是使用notna()和isna()方法完成的。

frame[frame['col1'].notna()]

在SQL中可以使用IS NULL和IS NOT NULL完成

SELECT *
FROM frame
WHERE col2 IS NULL;SELECT *
FROM frame
WHERE col1 IS NOT NULL;

 

三、更新

在SQL中使用UPDATE

UPDATE tips
SET tip = tip*2
WHERE tip < 2;

而在pandas中则有多种方法,比如使用loc函数

tips.loc[tips['tip'] < 2, 'tip'] *= 2

 

四、删除

在SQL中使用DELETE

DELETE FROM tips
WHERE tip > 9;

在pandas中,我们选择应保留的行,而不是删除它们

tips = tips.loc[tips['tip'] <= 9]

 

五、分组

在pandas中,使用groupby()方法实现分组。groupby()通常是指一个过程,在该过程中,我们希望将数据集分为几组,应用某些功能(通常是聚合),然后将各组组合在一起。

常见的SQL操作是获取整个数据集中每个组中的记录数。例如,通过对性别进行分组查询

SELECT sex, count(*)
FROM tips
GROUP BY sex;

入门数据分析选择Python还是SQL?七个常用操作对比

 

在pandas中的等价操作为

入门数据分析选择Python还是SQL?七个常用操作对比

 

注意,在上面代码中,我们使用size()而不是count() 这是因为count()将函数应用于每一列,并返回每一列中非空记录的数量!

六、连接

在pandas可以使用join()或merge()进行连接,每种方法都有参数,可让指定要执行的联接类型(LEFT,RIGHT,INNER,FULL)或要联接的列。

现在让我们重新创建两组示例数据,分别用代码来演示不同的连接

df1 = pd.DataFrame({'key': ['A', 'B', 'C', 'D'],....:                     'value': np.random.randn(4)})....: df2 = pd.DataFrame({'key': ['B', 'D', 'D', 'E'],....:                     'value': np.random.randn(4)})

内连接

内联接使用比较运算符根据每个表共有的列的值匹配两个表中的行,在SQL中实现内连接使用INNER JOIN

SELECT *
FROM df1
INNER JOIN df2ON df1.key = df2.key;

在pandas中可以使用merge()

入门数据分析选择Python还是SQL?七个常用操作对比

 

merge()提供了一些参数,可以将一个DataFrame的列与另一个DataFrame的索引连接在一起

入门数据分析选择Python还是SQL?七个常用操作对比

 

左/右外联接

在SQL中实现左/右外连接可以使用LEFT OUTER JOIN和RIGHT OUTER JOIN

SELECT *
FROM df1
LEFT OUTER JOIN df2ON df1.key = df2.key;SELECT *
FROM df1
RIGHT OUTER JOIN df2ON df1.key = df2.key;

在pandas中实现同样可以使用merge()并指定how关键字为left或者right即可

入门数据分析选择Python还是SQL?七个常用操作对比

 

全连接

全连接返回左表和右表中的所有行,无论是否匹配,但并不是所有的数据库都支持,比如mysql就不支持,在SQL中实现全连接可以使用FULL OUTER JOIN

SELECT *
FROM df1
FULL OUTER JOIN df2ON df1.key = df2.key;

在pandas中实现同样可以使用merge()并指定how关键字为outer

入门数据分析选择Python还是SQL?七个常用操作对比

 

七、合并

SQL中UNION操作用于合并两个或多个SELECT语句的结果集,UNION与UNION ALL类似,但是UNION将删除重复的行。示例代码如下

SELECT city, rank
FROM df1
UNION ALL
SELECT city, rank
FROM df2;
/*city  rankChicago     1
San Francisco     2
New York City     3Chicago     1Boston     4Los Angeles     5
*/

在pandas中可以使用concat()实现UNION ALL

入门数据分析选择Python还是SQL?七个常用操作对比

 

上面是UNION ALL保留重复值,如果希望删除可以使用 drop_duplicates()

入门数据分析选择Python还是SQL?七个常用操作对比

 

以上就是本文的全部内容,可以看到在不同的场景下不同的语言有着不同的特性

http://www.lbrq.cn/news/2795779.html

相关文章:

  • p2p网站建设价格百度正版下载恢复百度
  • 网站搭建论文app开发平台
  • 地图网站模板做网络推广可以通过哪些渠道推广
  • 如何在网站上做标记圈信息网站怎么优化关键词
  • 制作网站页面怎么做sem管理工具
  • 购物网站建设报价网站快速收录
  • 建设交通职业技术学院招聘信息网站中国科技新闻网
  • 做商城网站哪里买seo技术员
  • 政治工作网站管理建设网站seo推广公司靠谱吗
  • 台州网站搭建电商网站建设
  • 北京网站建设icp有限公司百度推广个人怎么开户
  • 网站服务器试用游戏广告推广平台
  • 自己做网站去哪买服务器seo建站技巧
  • 西安建网站价格免费学生网页制作成品
  • 做网站怎样找湖南搜索引擎推广平台
  • 个人响应式网站建设搜索引擎优化的办法有哪些
  • wordpress侧边栏目录seo单词优化
  • 网站建设的步骤教程下载2023年8月份新冠
  • 宁晋企业做网站广告关键词查询
  • 网站建设新闻发布注意什么怎么制作网站教程手机
  • 怎么自制网站dz论坛seo设置
  • 什么网站可以做项目网站关键词优化排名公司
  • 做关于什么的网站关键字排名查询
  • 巩义企业网站托管代运营公司网店代运营合同
  • 长安区网站建设小网站广告投放
  • 高新公司网站建设电话什么样的人适合做策划
  • 做h5的软件有哪些网奇seo赚钱培训
  • 网页设计证书考什么广州百度推广排名优化
  • php网站开发文档怎么制作一个简单的网页
  • 网站备案用户注销备案申请表国外网站推广平台有哪些?
  • Mokker AI:一键更换照片背景的AI神器
  • 面试后的跟进策略:如何提高录用几率并留下专业印象
  • k8s下的网络通信与认证
  • C++设计模式--策略模式与观察者模式
  • 神经网络中 标量求导和向量求导
  • mycat分库分表实验