LCE
LCE:一个结合了随机森林和XGBoost优势的新的集成方法 - 知乎 (zhihu.com)
from lce import LCERegressor
from sklearn.datasets import load_diabetes
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
# Load data and generate a train/test split
data = load_diabetes()
X_train, X_test, y_train, y_test = train_test_split(data.data,
data.target,
random_state=0)
# Train LCERegressor with default parameters
reg = LCERegressor(n_jobs=-1, random_state=0)
reg.fit(X_train, y_train)
# Make prediction
y_pred = reg.predict(X_test)
mse = mean_squared_error(y_test, reg.predict(X_test))
print("The mean squared error (MSE) on test set: {:.0f}".format(mse))
GAN
2021年2月70篇GAN/对抗论文汇总 - 知乎 (zhihu.com)
CMU联手Adobe:GAN模型迎来预训练时代,仅需1%的训练样本|CVPR 2022 - 知乎 (zhihu.com)
Predicting protein-peptide binding residues via interpretable deep learning
Predicting protein-peptide binding residues via interpretable deep learning - PubMed (nih.gov)
Bioinformatics | 通过可解释的深度学习预测蛋白质与多肽结合位点 (qq.com)
PepBCL是一个独立于特征设计的端到端的预测模型,在基准数据集上显著优于许多SOTA方法。此外,作者团队还探讨了PepBCL中注意力机制对于蛋白质结合区域中结合位点周围残基序列特征的挖掘能力,从而对模型如何预测结合位点进行了一定的解释。最后,为了方便研究人员使用,作者团队还搭建了一个在线预测平台作为所提出的PepBCL的实现,其服务可以访问如下网址:https://server.wei-group.net/PepBCL/。
该模型可以仅输入原始蛋白质序列进行预测蛋白质-多肽结合位点,不需要借助其他工具和手工特征设计,而且通过提出的对比学习框架,该模型可以有效地提高不平衡数据集上的预测性能。
正好可以用来一些没有结构的序列的分析