python文档查重

python文档查重

问:Python如何查询word文档中重复的公式和图片?
  1. 答:以WPS 2019版为例
    1. 打开文档,选中内容后,鼠标右键选择“复制”;
    2. 打开需要粘贴的文档,选中位置,鼠标右键选择“保留源格式粘贴”。
     
问:python代码查重原理
  1. 答:a=['python',1,2,3,1,6,'a','a',3,3,3,'a','python','3','8']
    b=list(set(a))
    cf=[]
    for i in b:
    cf.append(a.count(b))
    for i in range(len(b)):
    print(b[i],'一共有',cf[i],'个',sep='')
问:怎样用Python将百度云盘里的文件查重并删除
  1. 答:我没有见过百度有提供对外开放的网盘API,所以可能只有一个方法来解决,就是使用百度网盘客户端把网盘中所有的数据同步到本地,然后写个脚本在本地进行过滤、删除等操作,正常情况下这些操作也会同步到线上。
问:python中怎么提取两个文本文档相同的内容
  1. 答:建议两个文件的末尾都留一个空行,否则最后一行可能匹配不到
    fa = open('A.txt')
    a = fa.readlines()
    fa.close()
    fb = open('B.txt')
    b = fb.readlines()
    fb.close()
    c = [i for i in a if i in b]
    fc = open('C.txt', 'w')
    fc.writelines(c)
    fc.close()
  2. 答:把两个文档的所有内容全部读入,转换成两个集合,然后求两个集合的交集。
  3. 答:如果某文件里本身有重复,怎么算?
问:毕设python源码要怎么避免查重
  1. 答:避免抄袭,保证原创。实现更多功能,逻辑自己编写。
    还可以在上交之前,自己到相关平台上查重检查下,以免因为查重不过影响毕设的提交与审核。
python文档查重
下载Doc文档

猜你喜欢