当前位置: 首页 > news >正文

济南高新区 网站建设太原网站快速排名优化

济南高新区 网站建设,太原网站快速排名优化,做搜狗手机网站排,做网站南京平时学生交上机作业的时候经常有人相互复制,直接改文件名了事,为了能够简单的检测这种作弊行为,想到了检测文件的MD5值,虽然对于抄袭来说作用不大,但是聊胜于无,以后可以做一个复杂点的。# coding: utf8imp…

平时学生交上机作业的时候经常有人相互复制,直接改文件名了事,为了能够简单的检测这种作弊行为,想到了检测文件的MD5值,虽然对于抄袭来说作用不大,但是聊胜于无,以后可以做一个复杂点的。

# coding: utf8

import hashlib

import os

from collections import Counter

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

def get_md5_01(file_path):

md5 = None

if os.path.isfile(file_path):

f = open(file_path,'rb')

md5_obj = hashlib.md5()

md5_obj.update(f.read())

hash_code = md5_obj.hexdigest()

f.close()

md5 = str(hash_code).lower()

return md5

def get_md5_02(file_path):

f = open(file_path,'rb')

md5_obj = hashlib.md5()

while True:

d = f.read(8096)

if not d:

break

md5_obj.update(d)

hash_code = md5_obj.hexdigest()

f.close()

md5 = str(hash_code).lower()

return md5

if __name__ == "__main__":

output_list=[]

#input_path=r"e:\xx\新建文件夹"

#output_path = unicode(input_path , "utf8")

output_path=os.getcwd()

g = os.walk(output_path)

for path,dir_list,file_list in g:

for file_name in file_list:

output_list.append(os.path.join(path, file_name) )

md5_list= [get_md5_01(i) for i in output_list]

Counter_list=Counter(md5_list)

for i in Counter_list.items():

if i[1] >1:

duplicate_list=[ a for a in range(len(md5_list)) if md5_list[a] == i[0]]

print '-'*50

print i[0]

for j in duplicate_list:

with open('duplicate.log', mode='a+') as f:

f.write(i[0]+'\t'+output_list[j]+'\n')

print output_list[j]

补充知识:python一句话校验文件哈希值

MD5

python -c "import hashlib,sys;print hashlib.md5(open(sys.argv[1],'rb').read()).hexdigest()" 文件名

SHA-1

python -c "import hashlib,sys;print hashlib.sha1(open(sys.argv[1],'rb').read()).hexdigest()" 文件名

SHA-256

python -c "import hashlib,sys;print hashlib.sha256(open(sys.argv[1],'rb').read()).hexdigest()" 文件名

SHA-512

python -c "import hashlib,sys;print hashlib.sha512(open(sys.argv[1],'rb').read()).hexdigest()" 文件名

以上这篇Python实现检测文件的MD5值来查找重复文件案例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持python博客。

http://www.lbrq.cn/news/2777743.html

相关文章:

  • 做的最好的相亲网站有哪些独立站谷歌seo
  • 阿里云ace+wordpress网站快速优化排名方法
  • 中山网站建设的价格成人本科报考官网
  • wordpress 飞龙博客 许愿墙常德网站seo
  • 网站开发工程师助理百度百家号注册
  • 企业手机版网站百度网盘电脑版下载
  • 兰州做网站优化短视频推广公司
  • 做游戏网站赚钱吗seo效果检测步骤
  • 中卫网站推广优化公司seo的中文意思
  • 模板建站优缺点app开发工具
  • 怎么做跨境电商网站关键词搜索方法
  • 网站页脚设计代码百度官网平台
  • 到那里找做网站的兼职广州新闻最新消息今天
  • 如何设计购物网站龙岗网站设计
  • 仪征 网站建设亚马逊关键词优化怎么做
  • 西安紧急通知南京怎样优化关键词排名
  • 做网站开发要具备哪些素质电商网站卷烟订货流程
  • 牛商网建站最大的中文搜索引擎
  • 有没有做古装衣服的网站如何提升网站seo排名
  • 企业网站设计与建设站长工具关键词查询
  • 做普通网站公司吗甘肃seo技术
  • 专业web网站设计最火的推广软件
  • ie的常用网站厦门seo屈兴东
  • 温州公司做网站西安seo网站优化
  • 宁波建设协会网站首页百度收录好的免费网站
  • 网站开发中数据库的功能在线识别图片找原图
  • 手机网站开发ios广告代运营
  • 网站建设开发公司seo全网图文推广
  • 东莞网站建设定制互动营销用在哪些推广上面
  • 石岩做网站公司个人代运营一般怎么收费
  • 云手机矩阵:重构企业云办公架构的技术路径与实践落地
  • 关于诸多编程语言类型介绍
  • 线程(基本概念和相关命令)
  • Spring 创建 Bean 的 8 种主要方式
  • 中级统计师-会计学基础知识-第五章 财务报告
  • ​​Vue 3 开发速成手册