本地上传测序文件到Linux系统,做md5时发现有少数文件失败。
$ cat md5.check
84305_FDSW190448400-1a_1.fq.gz: OK
84305_FDSW190448400-1a_2.fq.gz: FAILED
md5sum: WARNING: 1 computed checksum did NOT match
可能是上传有误,也可能是本地测序文件本身不完整。但是文件太大,在没搞清楚源头之前,不宜再次上传。这时,在本地windows下对失败文件做MD5检验。
windows下安装的git没有md5sum,但windows自带有certutil校验:
certutil -hashfile <文件名> <hash类型>
用cmd命令行或git如下:
$ certutil -hashfile 84305_FDSW190448400-1a_2.fq.gz md5
MD5 的 84305_FDSW190448400-1a_2.fq.gz 哈希:
4bc35e5c5561efcd99fe3911e7488f11
CertUtil: -hashfile 命令成功完成。
比较下原始文件中的MD5,两者是一样的。
$ cat MD5_84305_FDSW190448400-1a.txt
f11f1eeadb5d75755eacad66136f48c4 84305_FDSW190448400-1a_1.fq.gz
4bc35e5c5561efcd99fe3911e7488f11 84305_FDSW190448400-1a_2.fq.gz
因此,判断是传输错误。看看是不是中断导致,先不覆盖,续传后校验再看,这样更省时间。
重新传完后,校验正确。
$ md5sum -c MD5_84305_FDSW190448400-1a.txt
84305_FDSW190448400-1a_1.fq.gz: OK
84305_FDSW190448400-1a_2.fq.gz: OK
ref:https://blog.csdn.net/ThinkAboutLife/article/details/110384620