勾引 卵白质组学各人数据库资源汇总
提到卵白质数据库,专家皆很熟谙了,基本上每个数据库皆会配备一个网页用具让专家查询大略作念一些通俗的卵白质数据分析勾引,以下是一些有名的卵白质组数据库:
TrEMBL: 由欧洲生物信息学究诘所(EMBL-EBI)保重的卵白质数据库,提供基于UniProt设施的自动堤防信息。UniProt: 一个全面的、高质地的卵白质数据库,包含来自UniProtKB/Swiss-Prot的手动堤防卵白质和来自TrEMBL的打算机堤防卵白质。Human Protein Atlas: 一个式样,旨在分析悉数东说念主类卵白质在多样组织中的抒发和定位。STRING: 一个数据库和积贮资源,提供已知和瞻望的卵白质-卵白质相互作用。然而卵白质组数据库并不是卵白质数据库,主若是ProteomeXchange定约,它是一个开放的、各人的数据存储平台,有利用于存储和分享质谱(MS)数据。它由多个卵白质组学数据存储库构成,包括PRIDE Archive、MassIVE、PeptideAtlas 以及iProX等 。
比如咱们不错看到一个卵白质组学著述:https://www.sciencedirect.com/science/article/pii/S0300483X20302912?via=ihub
Availability of data and materialThe proteomics data have been deposited to the ProteomeXchange Consortium via the PRIDE (Perez-Riverol et al., 2019) partner repository with the dataset identifier PXD020248.
ProteomeXchange的方向是促进数据的标准化、分享和再运用,复古卵白质组学究诘的进一步发展。它撤职FAIR原则(可查找性、可拜访性、互操作性和可重用性),以确保数据的质地和可用性。一般来说咱们熟谙iProX(海外卵白质组学相通平台)和PRIDE(卵白质组学浮滑数据库)即可:
iProX: iProX(海外卵白质组学相通平台)是一个由中国卵白质组学究诘者树立的数据库,旨在存储和分享基于质谱的卵白质组学数据。iProX为科研东说念主员提供了一个平台,用于提交、处置和拜访卵白质组学数据,复古数据的标准化和分享。iProX数据库也撤职ProteomeXchange的数据标准,影音先锋色情bt种子促进了全球卵白质组学数据的整合和分析。PRIDE: PRIDE(卵白质组学浮滑数据库)是EMBL-EBI(欧洲生物信息学究诘所)保重的一个数据库,它是ProteomeXchange定约的一部分。PRIDE有利网罗和存储质谱数据,终点是卵白质和肽段的浮滑和定量信息。PRIDE数据库复古用户上传数据、下载公开数据集,并提供了一系列的分析用具,匡助科研东说念主员进行卵白质组学究诘。PRIDE(卵白质组学浮滑数据库)是EMBL-EBI(欧洲生物信息学究诘所)保重的一个数据库,不错通过商量:https://www.ebi.ac.uk/pride/archive?sortDirection=DESC&page=2&pageSize=20
稽查数据库当今有的数据集数目:List of Datasets (27273)
比如最近的一个各人数据集便是:Neutrophil-derived migrasomes are an essential part of the coagulation system, mouse.
不错很了了的看到这个pride数据库为这个数据集提供了raw时势的质谱仪器数据,以及卵白质组抒发量矩阵文献:
图片
小鼠-两分组-卵白质组-相反分析数据集详备的数据集商量在:https://www.ebi.ac.uk/pride/archive/projects/PXD051229
不外咱们一般来说就开放内部的ms220042-dia-20220111.xls文献进行后续的卵白质组抒发量相反分析即可
iProX(海外卵白质组学相通平台)在 https://www.iprox.cn/page/BWV016.html 不错看到就 3,676 entries,因为是一个由中国卵白质组学究诘者树立的数据库,是以绝大部分数据集皆是中国科研职责者提供的,并且绝大部分皆是在PRIDE(卵白质组学浮滑数据库)也有一个id,如下所示;
图片
3,676 entries,纵情点击一个数据集进去:https://www.iprox.cn/page/ProjectFileList.html?projectId=IPX0006535000
Proteome of Chinese Breast Cancers (FUSCC-Shao Lab)IPX0006535000PartialPXD042886Jiang YZ, Shao ZM. Molecular features and clinical implications of the heterogeneity in Chinese patients with HER2-low breast cancer. Nature Communications. 2023 Aug 22;14(1):5112-. doi:10.1038/s41467-023-40715-x.Zhiming ShaoZhiming ShaoFudan University Shanghai Cancer Center12023-06-11 08:40:12
也不错看到它的其它id,只需要有id就不错拜访它在不同数据库内部的数据记载,比如:
https://proteomecentral.proteomexchange.org/cgi/GetDataset?ID=PXD042886https://www.ebi.ac.uk/pride/archive/projects/PXD042886如果数据集并莫得提供卵白质抒发量矩阵文献因为原来便是有许多不同的卵白质组学本事平台,比如 DIA、Label Free和TMT秀美,它们的各自的 数据预处理经由 也有点诀别哦:
DIA(Data-Independent Acquisition)数据预处理经由:Spectronaut搜库计谋:
使用Spectronaut软件进行搜库,获取肽段和卵白的相对定量信息。数据log2调遣、缺失值过滤和填充、数据标准化,可能使用Combat去除批次效应。DIA-NN搜库计谋:
使用DIA-NN进行搜库,得到相对定量值。进行log2调遣、数据标准化、缺失值处理,临了浮滑相反卵白。Label Free数据预处理经由:Maxquant搜库计谋:
搜库后果提供Intensity、iBAQ、LFQ intensity三种定量值。数据log2调遣、样本内中值或quantile标准化、缺失值过滤和填充。进行相反定量分析。Proteome Discoverer(PD)搜库计谋:勾引
默许定量值为iBAQ。标准化时势为FOT(Fraction of Total)。缺失值填充,选拔符合阈值进行填充。下贱数据分析。TMT(Tandem Mass Tag)数据预处理经由:MSFragger搜库计谋:使用MSFragger进行搜库,得到pepXML时势搜库后果文献。运用Philosopher用具包进行肽段、卵白和翻译后修饰的定量和过滤。PeptideProphet进行肽段浮滑和考据,PTMProphet进行修饰位点浮滑。ProteinProphet用于卵白浮滑。使用Philosopher进行FDR过滤和定量,赢得TMT reporter ion intensity。参考通说念样品翻新,进行多重数据调遣和标准化。log2调遣、样本内中值标准化、缺失值处理、批次效应去除、相反抒发分析。 本站仅提供存储做事,悉数本色均由用户发布,如发现存害或侵权本色,请点击举报。