赞
踩
欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/131115471
UniProt 是一个提供蛋白质序列和功能信息的数据库,由欧洲生物信息学研究所(EMBL-EBI)、美国瑞士生物技术信息中心(SIB)和美国蛋白质信息资源(PIR)共同维护。
UniProt 包括三个主要部分:UniProt 知识库(UniProtKB)、UniProt 非冗余参考集合(UniRef)和UniProt 档案(UniParc)。
以 升级 DeepMSA2 的搜索库为例,更新 MSA 搜索的全部蛋白序列库,包括UniRef90、BFD、MGnify、UniClust30、UniRef30、MetaClust、TARA、IMG、MetaSource等,如图所示:
配置信息位于:
dit_utils/constants.py
MSA库路径的修改,如下:
# 原始路径
libdir = "[Your Folder]/ITLIB" # template library directory
# 最新路径
libdir = "[Your New Folder]/msa_databases/deepmsa2" # template library directory
工程逻辑DeepMSA2_noIMG.pl
的修改,如下:
my $qhhblitsdb="$ITlibdir/uniref30/UniRef30_2022_02"; # upgrade v2: uniclust30_2017_04 -> UniRef30_2022_02
my $qjackhmmerdb="$ITlibdir/uniref90/uniref90.fasta"; # upgrade v2: file
my $qhhblits3db="$ITlibdir/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt"; # upgrade v2: file
my $qhmmsearchdb="$ITlibdir/mgnify/mgy_clusters_2022_05.fa"; # upgrade v2: mgy_clusters.clean.fasta -> mgy_clusters_2022_05.fa
my $dhhblitsdb="$ITlibdir/uniclust30/uniclust30_2018_08"; # upgrade v2: uniclust30_2017_04 -> uniclust30_2018_08
my $djackhmmerdb="$ITlibdir/uniref90/uniref90.fasta"; # upgrade v2: file
# upgrade v2: metaclust.fasta file; mgy_clusters.clean.fasta -> mgy_clusters_2022_05.fa
my $dhmmsearchdb="$ITlibdir/m
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。