网页开发的基本流程是什么seo优化排名服务
python遇到的问题
- 1 pandas问题
- 1.1 list转换为pandas对象再保存为Excel
- 1.2 dict转换为pandas对象再保存为Excel
- 1.3 pandas的对象最快遍历方法
- 1.4 python pandas 按照列指定格式读取
- 2 字符串
- 2.1 Python的数字填充000530格式化
- 2.2 python 字符串转日期,并日期加减
- 3 库依赖
- 3.1 安装python时Ignoring ensurepip failure:pip required SSL/TLS和There are no enabled repos
1 pandas问题
1.1 list转换为pandas对象再保存为Excel
import pandas as pd
from tqdm import tqdm
columns = ["id", "text"]
df = pd.DataFrame(conf, columns=columns) # conf是两层list,里面一层list类型是["1", "我爱你"]
df.to_excel(file_in_path.replace(".txt", ".xlsx"), sheet_name="Sheet1", index=0, columns=columns)
1.2 dict转换为pandas对象再保存为Excel
def write_xlsx(save_path, data:dict, columns:list):"""将dict类型的data数据写到pandas中,excel格式"""import pandas as pddf=pd.DataFrame(data)df.to_excel(save_path, sheet_name="Sheet1", index=0, columns=columns)
1.3 pandas的对象最快遍历方法
import pandas as pd
from tqdm import tqdm
xlsx_path = "demo.xlsx"
column_names = ["id", "text"]
column_names_map = { name:index for index,name in enumerate(column_names)} # list转换为map
df = pd.read_excel( xlsx_path )
conf = df[column_names].values # 将得到的是 两层list,对这个list遍历即可,速度最快,不要用df.iloc或df.loc
for line in conf:id = line[column_names_map["id"]]text = line[column_names_map["text"]]
1.4 python pandas 按照列指定格式读取
df = pd.read_excel('tmp.xlsx', dtype = { '公司代码' : str })
2 字符串
2.1 Python的数字填充000530格式化
str = '530';
result=str.zfill(6);
2.2 python 字符串转日期,并日期加减
import datetime
d1=datetime.datetime.strptime('20200630','%Y%m%d')
d2=datetime.datetime.strptime('20200730','%Y%m%d')
# 天数加1
d3=d1+datetime.timedelta(days=1)
d4=d1+datetime.timedelta(days=30)
# 会输出两天相等
d4==d2
# 日期格式化,输出20200730
d4.strftime('%Y%m%d')
3 库依赖
3.1 安装python时Ignoring ensurepip failure:pip required SSL/TLS和There are no enabled repos
没有安装OpenSSL库
yum install openssl-devel
sudo apt-get install libssl-dev