(不过上传数据真的网要好)
https://www.jianshu.com/p/ea2cbf68a3ce
https://www.jianshu.com/p/ea2cbf68a3ce
https://www.jianshu.com/p/6d5f735dafcc
学习链接
第一步,先注册账号 https://submit.ncbi.nlm.nih.gov/subs/sra/
新建NCBI上传
- 在NCBI的首页点Submit
[图片上传失败...(image-fbc7ca-1580613602040)]
然后选择上面的SRA,千万别选错了,选成下面的SRA会很麻烦很麻烦的
[图片上传失败...(image-1fc623-1580613602040)]
然后点New submission
完成认证
然后会提示你完成认证,至少有一个科研单位/大学的email
完善信息
这两个都选NO,为了省事。
填写相关项目信息
然后选数据类型,这里我选的是plant sample
[图片上传失败...(image-42a365-1580613602040)]
- 接下来就是最关键的部分了:填写数据相关表格 填写Attributes
[图片上传失败...(image-86aa8d-1580613602040)]
-
具体方法可以参考我的例子或NCBI的例子,从[这里如果不确定可以先参考下面的图片试着填一下,但是一定要注意:拉丁名一定要写对,否则可能需要至少2天才能改过来(需要NCBI人工修改)。
然后是完成metadata的表格填写
[图片上传失败...(image-1edbf7-1580613602040)]
开始上传数据。
如果数据较多就选第一个,较少就用http网页上传就可以了:
[图片上传失败...(image-339e9f-1580613602040)]
下面介绍如何用aspera批量上传大量数据。选中preload之后,会在下面出现相关的aspera命令和key。下载key到本地。
[图片上传失败...(image-7a206a-1580613602040)]
最好是是有自己的服务器,在服务器上进行下载
下载Aspera Connect
wget https://download.asperasoft.com/download/sw/connect/3.9.6/ibm-aspera-connect-3.9.6.173386-linux-g2.12-64.tar.gz
注意下载的版本,不同版本可能命令不一样,所以要多查看帮助文档
安装Aspera Connect
bash ibm-aspera-connect-3.9.6.173386-linux-g2.12-64.sh
添加并激活环境变量
echo 'export PATH=~/.aspera/connect/bin:$PATH' >> ~/.bashrc
source ~/.bashrc
调用帮助文档
ascp --help
安装aspera之后,输入以下代码,将aspera加入到环境变量,方便使用:
-
使用网页上给出的命令,上传数据(注意,-i后面是之前下载的key的绝对路径):
(说数据上传快的都是骗人的,不知道是我电脑还是我网的问题),
注意,如果少上传了数据,NCBI会提示你继续上传;但是如果上传多了,直接点下一步就可以了,NCBI会自动忽略多余的文件: