写在前面
Emmmm,慢慢地发现越来越多 TBtools 用户朋友发表的论文。农学的,医学的,大田的,分子的,湿实验的,数据分析的.... 我可能跟大家有所不同,看到有朋友文章发表并引用了 TBtools 时,我常常会关心的是:
- 用了啥功能?
- 用的如何?(比如可视化是否好看)
- 是否有出乎我意外的使用方式(相对常见)
现在几乎每天,我都会收到 Google Scholar 的邮件,大体提醒我,今天哪些(对哪些,一般都是两三篇)文稿发表并引用了 TBtools。我有时间就会看看。看多了,自然会发现一些我个人觉得还不错的 TBtools 应用结果(亦即,用户常常用得比我还好)。
于是,我决定在《生信札记》上,开一个板块《TBtools-用户文章解读》。主要目的:
- 我可以了解下用户都拿 TBtools 干啥了
- 给其他用户做参考,如 TBtools 还能这么用
- ....
文稿发现
不少 TBtools 用户本身也是我的微信朋友。早上在朋友圈看到了截图。
看来是老铁,直接把 TBtools 写到摘要里面去了.....这估摸着是第一次看好。哈哈。既然如此,那就选这篇文章来解读。
文稿解读
文稿发表在 Frontiers in Genetics,查了下JCR Q2。之前我也有多少看到过这个杂志,应还是不错。
基于题目和摘要,我们很清楚,作者主要工作是鉴定了大白菜的富甘氨酸蛋白基因家族,并分析其在胁迫条件下的表达模式,为后续进一步工作开展提供基础。
先看看结果部分的主标题:
- Identification and Characterization of BrGRP Genes in Chinese Cabbage 即家族成员鉴定
- Sequences Analysis of BrGRP Genes and Phylogenetic Relationship 即序列分析与进化分析
- Chromosome Localization and Orthologous Gene Analysis of BrGRPs in Chinese Cabbage 即基因的染色体定位与同源基因分析(结合拟南芥)
- Expression Profiling of BrGRPs in Chinese Cabbage 即成员的表达分析(包括不同组织,温度胁迫,干旱胁迫,软腐病菌侵染 - 基于公开已发表转录组)
- Analysis of Cis-Acting Elements in the Promoter Region of BrGRPs 即顺式作用元件分析
- Two BrGRP Genes Participated in NaCl Stress 即基于前述鉴定与表达分析,确定两个进一步分析的成员,开展实验验证
整体脉络简单且清晰,应属于相对中规中矩的文稿,完善了大白菜富甘氨酸蛋白基因家族的各项信息。文章中,有趣的点或许在于同一进化分支的两个GRP基因超表达后有相反的表型。
图片解读
上述,其实都不是我关心的内容,我最关心的,到底还是图片。
第一张图,看起来还不错,应该属于经典的 TBtools 出图。在 TBtools 中,类似的图可以一键一秒输出。不过,从这张图来看,作者应该是花了不少时间,其中包括:
- 子图标注 ABC 以及titles
- 分支高亮,这个看起来也是后期AI或者PS,自己加的
- 图例摆放
我个人觉得应该是花了不少时间和努力,已经是不错的结果。但是,仍然可以争取做得更好,把以后的工作再提升一下,争取发个 1 区的。个人愚见,如果按照 100 分满分来打分的话,我觉得这个结果可以拿 80 分。 主要值得优化的有两点,第一个是高亮的部分可以参考一些CNS文稿配色,同时再做透明化;第二个是 Bra028693 这个基因的长度可能过长,从 motifs 来看可能是基因组基因结构注释的偏差。当然,这个不会改变不了全文任何结果。如果后续要针对这个基因开展科研工作,那么值得做一下注释矫正,可以参考《生信札记》往期推文。具体不做展开。
第二张图,我觉得可以打 98 分。其中子图A 应该是网站或者是自己着色,与TBtools没啥关系,不做评价,所以100分。子图B,其实非常不错。不过我觉得基因与染色体之间的线可能不用那么长。目测似乎是骨灰级用户,出这张图的版本,必然是相对近期的版本。因为我对文本重叠做了优化。配色方面都不错。另外,作者这张图,其实是拟南芥和大白菜一起放,Emmm,加分。TBtools 出 Circos 图,我并未演示过如何同时搞两个家族,但是作者自己摸索出来了。真流弊
!
三张图一起看。在这块,作者主要是分析了大白菜各类转录组数据。工作量应还是不小的。热图上,目测应是用了 TBtools。用得不是非常出彩。哈哈,对于只有两个样品的,可以考虑近期推出的LayoutHeatmap或者是掰弯,显得好看。如果坚持用矩形类常规热图,TBtools的热图工具,可以直接限定cell width和cell height,这个对于后期组合图片,显得更友好。组合出来的图也好看一些。Venn图用的 TBtools 无疑,从配色可以看出。此处 Venn 用得恰当,故事点不错。此外是机智的用了 TBtools 的 UpsetPlot 分析了顺式作用元件的交集差集。作者应该是考虑到柱子太短,没啥好看的,于是自己打了数字。这个操作也是聪明。整体上热图全部打 80 分;Venn 打 100 分;UpsetPlot 打 90 分。UpsetPlot 的数字其实可以一键文字基部对齐,这个在AI或者CorelDraw都有。
实验部分的图...与TBtools 没半点关系。摆出来,不做解读。
写在最后
整体结果不错。关于基因家族分析,我个人一贯的态度是:每一个研究生都应该掌握,最好实操过。其中涉及到大量分子生物学基础知识,同时也可以增加对目前所谓生物大数据的一些结果理解和小坑(如上述可能存在的基因结构注释偏差)。关于基因家族分析发表文稿,我持中立态度。我个人基本上做分析,主要是为了确定分支成员,服务于大的课题。但我们不得不承认,对于硕博士入学,夯实生物数据分析基础,保证毕业;或者对于新入职的青年教师,应对职称评定压力;发表文稿,或许是无解之解。当然,最好是类似本文,能够找到一些有趣的点,最好是服务于气候的大课题。比如,你做植物衰老,看看NAC;你做植物细胞分化,看看WUS,等等。