悟空:快速查看与分析数据云平台

悟空正在计算,请稍后......

简要声明


使用悟空云平台,欢迎引用站主的文章:

1. (2019) Shisheng Wang , Yue Cai, Jingqiu Cheng, Wenxue Li, Yansheng Liu and Hao Yang. motifeR: An Integrated Web Software for Identification and Visualization of Protein Post‐Translational Modification Motifs. Proteomics: 201900245. (2018 IF: 3.106). Link to article.

2. (2019) Shisheng Wang and Hao Yang. pseudoQC: A Regression‐Based Simulation Software for Correction and Normalization of Complex Metabolomics and Proteomics Datasets. Proteomics: 1900264. (2018 IF: 3.106). Link to article.

3. (2018) Shisheng Wang , ..., and Meng Gong. MetaboGroupS: A Group Entropy-Based Web Platform for Evaluating Normalization Methods in Blood Metabolomics Data from Maintenance Hemodialysis Patients. Anal Chem 90, 11124-11130. (2017 IF: 6.042). Link to article.

4. (2018) Shisheng Wang , ..., and Hao Yang. MixProTool: A Powerful and Comprehensive Web Tool for Analyzing and Visualizing Multigroup Proteomics Data. Journal of computational biology : a journal of computational molecular cell biology 25, 1123-1127. (2017 IF: 1.191). Link to article.

5. (2018) Qing-Run Li, Shi-Sheng Wang(共一作) , Hong-Wen Zhu, Fang-Ying Xia, Peter Roepstorff, Jia-Rui Wu, and Rong Zeng. Data-Independent Acquisition Mass Spectrometry to Localize Phosphosites. bioRxiv: 464545. Link to article.


部分已引用或致谢悟空云平台的文章:

1. Zhu, Ying, et al. Spatially resolved proteome mapping of laser capture microdissected tissue with automated sample transfer to nanodroplets. Molecular & Cellular Proteomics 17.9 (2018): 1864-1874.

2. Liang, Yiran, et al. Spatially resolved proteome profiling of <200 cells from tomato fruit pericarp by integrating laser-capture microdissection with nanodroplet sample preparation. Analytical chemistry 90.18 (2018): 11106-11114.

3. Wu, Yu, et al. Imbalance in amino acid and purine metabolisms at the hypothalamus in inflammation-associated depression by GC-MS. Molecular BioSystems 13.12 (2017): 2715-2728.

4. Chen Q Y, Zhong Q, Zhou J F, et al. Development and External Validation of Web-Based Models to Predict the Prognosis of Remnant Gastric Cancer after Surgery: A Multicenter Study[J]. Journal of Oncology, 2019.


1. 本平台基于R语言开发,旨在辅助您 快速分析 自己的数据, 提高学习与工作效率 ,并时时展现结果,做到友好的 人机交互 。此外,本网站还汇集不少学习资料,比如各种回归模型,分类模型等,方便大家理解与使用,功能使用可参考站主以前做的直播录制视频: http://www.bilibili.com/video/av13965184 。网站后续还会逐渐增加相应内容,学无止境,你我共勉,加油^_^。此外,站主已经开通关于本平台的微信公众号,大家可以扫码关注并分享下(感谢~~),公众号会不定期对平台每一个模块的相关知识点做详细的介绍以及关于平台的一些动态变化(本网站最终解释权归站主所有,始于2016年6月4日):

2. 在这里,你可以用到这些功能。更多功能请到 功能圈 中查看使用!

3. 学习是一种乐趣,交流使人进步。大伙都在这里: 688728477。

4. 本网站的 “金牌赞助公司” ---上海易算生物科技有限公司:

5. 分享也是一种善举哦:

6. 有问题,请发邮件至:wsslearning@omicsolution.com。

本网站目前支持的数据格式主要有:

1> .xlsx格式;

2> .xls格式;

3> .csv格式;

4> .txt格式;

5> .fasta格式。

该类数据形式一般为:行名为对象名称(比如鉴定到的每一个蛋白质或者基因名称,或者相对应的ID号);列名是每个样本的名字;数值代表的是定量强度值或者log变换值。比如下面的数据,行名是鉴定到蛋白质的Uniprot ID号,列名是每个样本的名字,数值是定量的强度值:

定量强度数据

该类数据形式一般为:行名为对象名称(比如鉴定到的每一个蛋白质或者基因名称,或者相对应的ID号);列名是每个样本的名字;数值代表的是定量的比值。比如下面的数据,行名是鉴定到蛋白质的Uniprot ID号,列名是每个样本的名字,数值是定量比值:

该类数据形式一般为:只有一列数据,也就是鉴定到的蛋白质或者基因名称,或者对应的ID号。比如下面的数据,其为鉴定到蛋白质的Uniprot ID号

数据筛选


下载数据

选择列之后的数据:

数据前处理:

统计分析工具:

功能分析工具:

数据可视化工具:

医学数据分析:

googlescholarR:

此模块主要是为了更加方便国内小伙伴们的文献查询,该模块和《sci-hub文献搜索》模块配合使用,效果更佳哦: https://www.omicsolution.org/wkomics/passwd/googlescholarR

Sci-hub文献查询:

Sci-hub维基百科介绍:https://en.wikipedia.org/wiki/Sci-Hub。该模块主要是将常用链接汇聚在一起,替小伙伴们去尝试哪一个可用,这会节省小伙伴不少时间。 https://www.omicsolution.org/wkomics/passwd/scihubsousuo

PubMed查询与分析:

PubMed官网介绍:https://www.ncbi.nlm.nih.gov/books/NBK3827/。该模块参考PubMed数据库中的记录,可帮助您查找您所关心的一些课题或者研究对象的相关资料。 https://www.omicsolution.org/wkomics/passwd/pubmedchaxun

googlefilterR:

该模块的搜索结果主要与R语言相关的,相当于对Google的搜索结果做了一些过滤,更加方便R语言用户的查询。 https://www.omicsolution.org/wkomics/passwd/googlefilterR

监控CRAN官网函数包:

该模块主要是对CRAN(官网:https://www.r-project.org/)上的R函数包进行监控,方便大家查看CRAN上函数包的变化,以及查找最新更新的包和删除的包,以求让大家更加及时有效的掌握R包的最新动态。 https://www.omicsolution.org/wkomics/passwd/RPdingshi

快速选择R包:

该模块主要是对CRAN(官网:https://www.r-project.org/)上的R函数包进行分析,方便大家根据关键字快速找到相应的R包,然后去学习使用。 https://www.omicsolution.org/wkomics/passwd/selectRP

书籍搜索:

该模块主要是提供书籍下载过渡链接,主要基于Library Genesis来源,此模块只是提供一个过渡,以求更加方便国内小伙伴使用。 https://www.omicsolution.org/wkomics/passwd/scitechbooks

ViziometricsR:

该模块主要方便于国内用户使用Viziometrics进行查询相关资料,官网:http://viziometrics.org/search/。 https://www.omicsolution.org/wkomics/passwd/viziometricsR

回归模型汇总:

监督学习模型汇总:

非监督学习模型汇总:

PDF图片格式转换:

该模块主要是方便大家将pdf矢量图转换成相应的位图。 https://www.omicsolution.org/wkomics/passwd/pdfconvert

PDF文本挖掘:

该模块主要是方便大家对pdf文本,比如相关文献,进行文本挖掘,看其所包含的主要词汇有哪些。 https://www.omicsolution.org/wkomics/passwd/pdftext

深度学习猜测图片内容:

该模块主要是利用现有的深度学习模型对图片的内容进行猜测。 https://www.omicsolution.org/wkomics/passwd/guesspicture

线条流动图内容:

该模块主要是将线条的速度根据图片像素的大小进行控制,从而展现出相应的波动图。 https://www.omicsolution.org/wkomics/passwd/funbodong

查看图片中的颜色:

该模块主要是将你喜欢的图片中所用到的颜色提取出来。 https://www.omicsolution.org/wkomics/passwd/getcolor

简要介绍:

该模块基本涵盖了蛋白质组学分析所用的常用框架,主要包括:数据筛选--缺失值处理--数据质量控制--假设检验--火山图--PCA、PLS-DA、OPLS-DA--HCA、MFUZZ--GO富集分析--KEGG富集分析--KEGG通路图--STRING网络图。点击这里开始体验吧^_^: https://www.omicsolution.org/wkomics/passwd/modelchuanshao1

其示意图如下:

简要介绍:

该模块基本涵盖了代谢组学分析所用的常用框架,主要包括:数据筛选--缺失值处理--数据质量控制--假设检验--火山图--多元统计方法(HCA、PCA、PLS-DA、OPLS-DA)--通路富集分析。点击这里开始体验吧^_^: https://www.omicsolution.org/wkomics/passwd/modelchuanshao2

其示意图如下:

简要介绍:

该模块基本上是‘串烧斗勺版’的翻版,只不过是已经发表了的模块,使用悟空云平台,欢迎引用我们的文章:《Shisheng Wang, Wen Zheng, Liqiang Hu, Meng Gong, and Hao Yang. MixProTool: A Powerful and Comprehensive Web Tool for Analyzing and Visualizing Multigroup Proteomics Data. Journal of Computational Biology (2018).10.1089/cmb.2018.0050.》。点击这里开始体验吧^_^: https://www.omicsolution.org/wukong/MixProTool

其示意图如下:

简要介绍:

该模块利用组熵的概念去评价多种标准化方法,从而选出较为适合你数据的方法。使用悟空云平台,欢迎引用我们的文章:《Shisheng Wang, Xiaolei Chen, Dan Du, Wen Zheng, Liqiang Hu, Hao Yang, Jingqiu Cheng, and Meng Gong. "MetaboGroupS: A Group Entropy-based Web Platform for Evaluating Normalization Methods in Blood Metabolomics Data from Maintenance Hemodialysis Patients." Analytical chemistry (2018).DOI: 10.1021/acs.analchem.8b03065》。点击这里开始体验吧^_^: https://www.omicsolution.org/wukong/MetaboGroupS

其示意图如下:

简要介绍:

该模块基本涵盖了Weighted correlation network analysis(WGCNA)分析所用的常用功能,其官网:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA,参考文献:doi:10.1186/1471-2105-9-559,更多详尽介绍可到其官网进行查看。点击这里开始体验吧^_^: https://www.omicsolution.org/wkomics/passwd/wgcnapart1

其示意图如下:

简要介绍:

该模块目前主要利用四种常用的回归模型,从蛋白质组或者代谢组的样本数据中对质控数据(Quality Control)进行模拟(即‘拟质控数据’或‘伪质控数据’,pseudoQC)。可能应用的场景有:1. 数据中没有QC样本的;2. QC数据质量不是很好的。尤其是再当数据出现较为验证的批次效应时,该工具可能可以提供一种尝试。点击这里开始体验吧^_^: https://www.omicsolution.org/wukong/pseudoQC

其示意图如下:

简要介绍:

该模块目前主要用于蛋白(肽段)翻译后修饰motif分析,除了传统的一类位点分析以外,其还可以分析多位点的motif以及非一类位点的motif,也许该工具可以帮助你发现新的有意思的motif。点击这里开始体验吧^_^: https://www.omicsolution.org/wukong/motifeR

其示意图如下:

简要介绍:

“一键式出结果”模块主要是为了更加方便大家进行数据分析,导入数据表格后,点击“开始分析”按钮即可进行分析, 分析完成后会给出结果链接,下载后即可进行结果查看。点击这里开始体验吧^_^: https://www.omicsolution.org/wkomics/passwd/onekeyresult

其示意图如下:

烂笔头印象派之地

俗话说‘好记性不如烂笔头’(英文翻译:The palest ink is better than the best memory.), ‘烂笔头印象派之地’旨在给大家提供一个印象记忆。因为大家都知道,各类编程语言的命令、函数绝对是浩如烟海, R语言也不例外,甚至更过分,即便你有洪荒之力,也只能望之兴叹:老夫实在记不了这么多啊! 那么,在这里,只要你有这样的一个感觉:‘这个函数貌似以前在哪里见过,等我到‘悟空’上去找找...’。 如是这样,很好,我们的目的就达到了。

学无止境,绝对是活到老,学到老,一起加油努力吧!

不管在哪一方面,如果你觉得本网站能帮得到你或给你的学习、工作带来方便,可以选择性的打赏一下站主^_^

支付宝红包打赏:


微信红包打赏:

请导入你的jpg格式的图片:

啊哈哈,下面是谁的素描这么靓呀^_^:


游戏简介:灭灯游戏(Lights Out)是一款益智小游戏,你的终极目标旨在 关掉所有的灯。 “经典模式”是指点击某一盏亮灯时则其被关灭(反之则点亮),同时,它旁边的亮灯被关灭,灭灯被点亮; “变体模式”是指点击某一盏亮灯时则其被关灭(反之则点亮),同时,与它同列和同行的亮灯被关灭,灭灯被点亮。


特别感谢游戏开发者:Dean Attali

哇塞,壮士厉害,你赢了^_^

26. 悟空(第二十六版 Version 26 / 2020-02-15):新增分组计算变异系数模块,一致性聚类分析模块,画成组箱线图模块,分组点线圆圈图模块,散点热图第二版模块;优化数据表转换模块,画功能关联图模块,motif分析中文版模块,假设检验分析模块,GO富集分析第二版模块,PLS-DA模块。并修复一些用户反馈的问题。

25. 悟空(第二十五版 Version 25 / 2019-12-22):新增pseudoQC分析模块(站主已发表的工具),motieR模块(站主已发表的工具),KEGG代谢组通路熵方法,画相关性连线图模块,画误差线bar图模块;优化KEGG富集分析模块,GO富集分析(自己上传背景)模块,Lasso回归模块,气泡包裹图模块,多组学富集模块,PCA分析模块,画变量气泡图模块,OPLS-DA模块,OPLS-DA分析(可针对多组样本)模块,画密度热图模块,GO富集分析第二版模块,画箱线图模块;最后修复一些其他已知bug和用户反馈的一些问题。

24. 悟空(第二十四版 Version 24 / 2019-10-01):新增灰色关联模块,代谢物KEGG富集分析模块,GO富集分析第二版模块,画常规矩阵气泡图模块,画三元图模块,画条件分类树,画和弦图,画旭日图,画瀑布图模块,画相关性线图模块;优化代谢组KEGG通路图模块,画Venn图模块,画热图模块,WGCNA模块,GOplot模块,ID号查询模块,OPLS-DA分析(可针对多组样本)模块,基因组和代谢组KEGG通路图(KEGG Pathway)模块,画聚类图模块,MFUZZ模块,画两矩阵间的相关性图模块;最后修复一些其他已知bug和用户反馈的一些问题。

23. 悟空(第二十三版 Version 23 / 2019-08-15):在这一版中我们继续升级了悟空云服务器,并且新增医学数据处理模块,后续会抽时间继续更新优化相关功能。新增冗余分析RDA模块,传统DNB模块,CSN模块,画相关性图+网络图模块,画热图+趋势图模块,画气泡图模块,画桑基图模块,画生存曲线图模块,画趋势密度分布图模块,画气泡包裹图模块,画功能关联图模块;优化代谢物LC-MS查询模块,画雷达图模块,GO富集结果模块,假设检验模块,GOblast模块,画ROC模块,画稍复杂的相关性网络模块,蛋白质组和代谢组富集模块;最后修正一些其他已知bug和用户反馈的一些问题。

22. 悟空(第二十二版 Version 22 / 2019-06-06):这一版我们升级了悟空云服务器,更改了悟空云官方网址,并且将可视化模块中的每一个功能都用对应的输出图片展示,这样方便用户更好的了解对应的模块都做了什么。新增失拟检验模块,评估肿瘤纯度模块,画稍微复杂些的相关性网络图模块,画配对连线散点图模块,画鱼图模块,画分组配对连线图,画李克特量表(Likert Scale)数据可视化模块,画Bar图+假设检验模块;优化线性判别分析模块(是否添加标签),画树状图(覆盖颜色)模块,线性回归诊断模块,代谢物富集分析模块,词云显示不全的问题,丰富雷达图功能;最后修正一些其他已知bug和用户反馈的一些问题。

21. 悟空(第二十一版 Version 21 / 2019-04-07):新增MCMC回归模块,肽段Motif分析模块,画交叉误差线点图模块,画3D散点图模块,画极坐标花瓣图模块,画树状图覆盖颜色模块;优化假设检验模块,缺失值填充模块,画火山图模块,决策树模块,标准化模块提示框显示形式;最后修正一些其他已知bug和用户反馈的一些问题。

20. 悟空(第二十版 Version 20 / 2019-02-21):新增GOplotweb模块,UNIPROT ID号转换模块,贝叶斯变量筛选模块,非线性拟合参数估计模块,从图片中提取颜色模块,msp转txt文件模块;并增加画金字塔展示图模块,画云雨图模块;优化缺失值填充模块、PLS-DA模块部分结果显示不出的问题、PCA模块数据多时显示问题、相关性图2模块、词云模块、画motif图模块。最后修正一些其他已知bug。

19. 悟空(第十九版 Version 19 / 2018-12-09):新增均值移动聚类模块,新增提取MaxQuant结果模块,新增数据Log转换模块,新增画漏斗图模块,并优化画维恩图模块,优化画相关性网络图模块,优化PDF文本分析模块,优化HCA显示的问题,优化OPLS-DA模块,修复PLS-DA下载的问题。最后修正一些已知bug。

18. 悟空(第十八版 Version 18 / 2018-10-08):新增主坐标分析(PCOA)模块,生成颜色图例模块,快速选择R包模块,PDF文本挖掘模块,高斯混合模型聚类模块,画线条流动图模块等众多新功能。此外,也新增两个站主已发表的模块:MetaboGroupS模块和MixProTool模块,使用云平台任何模块都欢迎引用这两篇文章。优化蛋白质组数据处理流程模块等,并修复一些已知bug。

17. 悟空(第十七版 Version 17 / 2018-08-07):新增深度学习识别图片内容模块,至此,悟空云平台现已支持数据前处理,(单元和多元)统计分析,富集分析,常规机器学习(监督和非监督),深度学习(DL),画图,文献书籍资料查询搜索,文本分析等内容。此外,新增ViziometricsR模块,数据表转换模块,对图片进行打点模块,画柱状图和概率密度分布图模块,画普通分组散点图模块,画极坐标bar图模块,优化upset交集图模块等,并修复一些已知bug。

16. 悟空(第十六版 Version 16 / 2018-06-07):新增聚类选择变量模块(可辅助我们选择特征变量),线性判别分析(LDA)模块,因子分析模块,此外也新增一些画图功能,如概率分布图画图模块,画网络图模块(网络图更加具有立体感),并优化googlefilterR模块,使其更加稳定,PLS-DA模块,GO富集分析柱状图可视化模块,KEGG富集模块等,并修复一些已知bug。

15. 悟空(第十五版 Version 15 / 2018-04-13):新增googlescholarR文献查询功能,googlefilterR搜索引擎,书籍查询,监控CRAN官网R函数包模块,Lasso回归模块,apcluster模块,求两个矩阵之间的相关性模块,t-sne模块,代谢物确定模块并将其数据库更新到最新版,此外也新增一些画图功能,如标准化+箱线图模块,并优化交集图模块,火山图作图模块等,并修复一些已知bug。

14. 悟空(第十四版 Version 14 / 2018-02-14):新增SCI-HUB文献搜索功能,WGCNA流程化处理模块,oplsda处理多组样本模块,PubMed查询与分析模块,宏基因组Tax4Fun功能预测,pdf文件与相应图片格式转换功能。此外也新增一些画图功能,如画ROC曲线,相关性画图第二种画法,小提琴图第二种画法,画堆叠连线柱状图,画带圈的散点图等模块,并修复一些已知错误。

13. 悟空(第十三版 Version 13 / 2017-12-15):添加第二个模型串烧模块(串烧插线版,主要针对代谢组数据处理),该模块主要将处理代谢组常用方法组合在一起(目前涵盖:数据前处理---数据质量控制---统计分析---通路富集分析---可视化等功能),以求方便使用并提高大家数据处理的效率。此外也新增自己上上传背景库做GO分析、稳定的逻辑回归、画数值分布图等模块,并优化KEGG通路图显示、数据标准化处理、维恩图等模块、也修复一些已知错误。

12. 悟空(第十二版 Version 12 / 2017-11-15):新增多组学富集分析模块,其目前主要针对蛋白质组和代谢组数据,其中也是主要整合了KEGG、Reactome、WikiPathways等数据库中人的数据,此外也新增ID号查询模块、画桑基图功能、画载荷矩阵网络图,并优化HCA作图模块、GO分析作柱状图、GO富集分析的结果展示、相关性网络模块结果展示,也修复一些已知错误。

11. 悟空(第十一版 Version 11 / 2017-10-19):新增代谢物通路富集模块,其中主要整合了KEGG、Reactome、WikiPathways等数据库中人的数据,且支持常见几种代谢物ID号之间的转换,此外也新增箱线图模块、生存分析之求样本量模块,并优化相关性图颜色参数设置、GO结果作图、烂笔头印象派等模块,也修复一些已知错误。

10. 悟空(第十版 Version 10 / 2017-09-24):新增模型串烧板块(主要针对蛋白质组数据处理),该板块旨在将各个模块串连起来对数据进行系统地分析,以求达到更加简易的目的,在第一个串连的模块中,涵盖了数据清洗---统计分析---功能分析---可视化等功能,并在各个模型中又进行了进一步的优化。此外还增加了层次分析法,并修复一些已知错误。

9. 悟空(第九版 Version 9 / 2017-07-23):新增数据筛选、监督学习模型(随机森林树、支持向量机、前馈神经网络、反向传播神经网络)、非监督学习模型(SOM、Kmeans模型)等分析模块,并修复一些已知错误。至该版,悟空数据分析平台已经涵盖 数据清洗---统计分析---功能分析---可视化---机器学习 等各个层面,目前共有49个大类模块可供大家使用和学习。

8. 悟空(第八版 Version 8 / 2017-07-12):新增回归诊断、各类逻辑回归、决策树分类、助推法分类、激酶-底物富集分析、画气泡图、画小提琴图等功能,优化了相关性分析模块,并修复一些已知错误。

7. 悟空(第七版 Version 7 / 2017-06-13):新增关联规则分析、功效分析等模块,添加了画带边缘密度的散点图功能,优化了PCA、HCA模块,并修复一些已知错误。

6. 悟空(第六版 Version 6 / 2017-04-30):悟空数据处理与分析平台全新改版,形式上,版面重新规划与布局;内容上,新版的平台在以往的基础上,新添加读取.xlsx或.xls数据文件功能,支持一些数据个性化操作;新增OPLSDA,SIMCA数据分析模块,并推出一键出报告的功能模块,方便大家使用。

5. 悟空(第五版 Version 5 / 2016-10-31):添加画树状图(dendrogram)、motif图、词云图、ID号转换功能,并改善KEGG柱状图显示。此外又增加在指定物种下blast序列并做KEGG分析的功能,其支持现有4325个物种数据库,并修复一些已知错误。

4. 悟空(第四版 Version 4 / 2016-08-10):开放一个新版块‘烂笔头印象派’。假设检验中新增支持每一个对象在多组之间的检验,添加了画QQ Plot图、以及蛋白质String网络图等功能,并修复一些已知错误。

3. 悟空(第三版 Version 3 / 2016-07-25):更换了服务器,访问速度和计算能力有很大提升。添加了画韦恩图、相关性网络图、以及蛋白质组学后处理分析(如:GO分类、富集、KEGG分析等)等功能,并修复一些已知错误。

2. 悟空(第二版 Version 2 / 2016-06-19):添加了处理缺失值(NA)方法、假设检验,画相关性图、火山图、定量比较图等功能,并修复一些已知错误。

1. 悟空(第一版 Version 1 / 2016-06-08):蛋白质组学常用方法:PCA(PLS-DA)、HCA、Mfuzz,俗称“三板斧”。