当前位置: 首页 > news >正文

营销网站的概念/百度智能云建站

营销网站的概念,百度智能云建站,成都装修办公室公司,集团公司做网站快速入门 Pandas 建议先看看集智主站的《10分钟Pandas之旅》系列: [Pandas] 10分钟Pandas之旅 01 - 集智专栏​jizhi.im[Pandas] 10分钟Pandas之旅 02 - 集智专栏​jizhi.im 以及用 Pandas 进行表格整合的教程: [Pandas] 表格整合三大神技之CONCATENATE …

快速入门 Pandas 建议先看看集智主站的《10分钟Pandas之旅》系列:

[Pandas] 10分钟Pandas之旅 01 - 集智专栏​jizhi.imv2-4239a439e41f8978acdf0c69302c2de0_180x120.jpg[Pandas] 10分钟Pandas之旅 02 - 集智专栏​jizhi.imv2-7f41d681f9064d6b4b1216e3ea017cf0_180x120.jpg

以及用 Pandas 进行表格整合的教程:

[Pandas] 表格整合三大神技之CONCATENATE - 集智专栏​jizhi.imv2-a278ee59b5d092f1353714a5f06cecca_180x120.jpg

我们都知道 Pandas 是专门用于 Python 数据分析的工具,不仅能非常快地读取与处理数据,而且还能轻松处理浮点数据中的缺失数据(表示为 NaN)以及非浮点数据。数据科学家 George Seif 近日分享了使用 Pandas 进行数据分析时的 23 段重要代码,掌握了它们对你熟悉 Pandas 一定大有帮助,集智现将它们分享过来。

这 23 种操作分为 3 个部分:获取基本的数据集信息、基本的数据处理和 DataFrame 操作。

获取的基本的数据集信息

读取CSV格式的数据集

pd.DataFrame.from_csv(“csv_file”)

pd.read_csv(“csv_file”)

读取Excel数据集

pd.read_excel("excel_file")

将DataFrame直接写入CSV文件

采用逗号为分隔符,无索引。

df.to_csv("data.csv", sep=",", index=False)

基本的数据集特征信息

df.info()

基本的数据集统计信息

print(df.describe())

在表格中打印出DataFrame

print(tabulate(print_table, headers=headers))

其中“print_table”是一个列表,其中列表元素还是新的列表,“headers”为表头字符串组成的列表。

列出所有列的名字

df.columns

基本的数据处理

删掉缺失数据

df.dropna(axis=0, how='any')

替换缺失数据

df.replace(to_replace=None, value=None)

用“value”替换其中的“to_replace”。

检查空值(NaN)

pd.isnull(object)

检查缺失值(数值数组中的 NaN ,对象数组中的 None/NaN)。

删除特征

df.drop('feature_variable_name', axis=1)

axis 选择 0 表示行,选择1表示列。

将对象类型转为浮点型

pd.to_numeric(df["feature_name"], errors='coerce')

将对象类型转为数值,我们就能进一步执行计算(以防它们为字符串)。

将 DataFrame 转换为 NumPy 数组

df.as_matrix()

获取DataFrame的前“n”行

df.head(n)

通过特征名获取数据

df.loc[feature_name]

DataFrame操作

对 DataFrame 使用函数

该函数会将 DataFrame 中“height”列的所有值乘以2:

df["height"].apply(lambda height: 2 * height)

def multiply(x):

return x * 2

df["height"].apply(multiply)

重命名列

下面代码会将DataFrame 的第三列重命名为“size”:

df.rename(columns = {df.columns[2]:'size'}, inplace=True)

取某一列的唯一entry

下面代码将取“name”列的唯一entry:

df["name"].unique()

获取子DataFrame

下面从 DataFrame 中选择性地获取“name”和“size”两列:

new_df = df[["name", "size"]]

总结数据信息

# dataframe中值的和

df.sum()

# dataframe中的最低值

df.min()

# 最高值

df.max()

# 最低值的索引

df.idxmin()

# 最高值的索引

df.idxmax()

# dataframe的统计信息总结,比如中位数等

df.describe()

# 平均值

df.mean()

# 中位值

df.median()

# 列之间的关系

df.corr()

# 只获取一列的值

df["size"].median()

给数据排序

df.sort_values(ascending = False)

布尔型索引

以下代码将过滤名为“size”的列,并仅显示值等于 5 的列:

df[df["size"] == 5]

选择特定值

以下代码将选定“size”列的第一行的值:

df.loc([0], ['size'])

http://www.lbrq.cn/news/1098919.html

相关文章:

  • 微信公众号影视网站怎么做/磁力蜘蛛
  • 网站注册域名位置/黑帽seo是什么意思
  • 上海快速建站/今日新闻 最新消息 大事
  • jsp做新闻网站/免费seo诊断
  • 网站建设目录结构doc/网络推广方案有哪些
  • 网页制作怎么插视频/广告优化师适合女生吗
  • 压铸东莞网站建设/东莞网站建设seo
  • 吉林省科瑞建设项目管理有限公司网站/对网站提出的优化建议
  • 网站源码网/国内免费域名注册网站
  • 做网站后端需要掌握什么技术/百度搜索排名优化哪家好
  • 厦门百度网站建设/自己建网站要多少钱
  • 免费ppt资源网站/南宁seo排名外包
  • 安徽论坛网站建设/广告多的网站
  • 政府网站建设工作存在的不足/百度网页版链接
  • 使用别人网站代码做自己的网站/搜索热门关键词
  • 网站排名恢复/网站技术解决方案
  • 宁波专业网站建设公司/近期的时事热点或新闻事件
  • html5做视频网站/企业线上培训平台
  • 大连做网站billionseo/搜索关键词优化
  • 全国做网站的公司有哪些/百度推广需要多少钱
  • 网站开发工程师月薪/企业网站推广优化公司
  • 商务网站建设的流程/重庆seo网络优化师
  • 郑州汉狮公司做网站/渠道推广费用咨询
  • 做国际网站多少钱/网络软文名词解释
  • 建筑网址大全网站/网站优化排名软件哪些最好
  • 宣传 网站建设方案/疫情排行榜最新消息
  • 怎么选择昆明网站建设/引擎搜索
  • 如何建设网站方便后期维护/seo教程
  • seo教程书籍/公司关键词排名优化
  • 启航做网站好吗/营销推广软文
  • ACE 插入元件
  • AI Agent与MCP协议构建标准技术报告(2025Q3)
  • Js进阶案例合集
  • 将 RustFS 用作 GitLab 对象存储后端
  • ElasticSearch:不停机更新索引类型(未验证)
  • Vuex 核心知识详解:Vue2Vue3 状态管理指南