您的图片您做主——多种降维方法展示样本重复性
在获得定量数据后,我们经常会通过PCA图来查看样本重复性。样本重复性不好怎么办?SBC ToolBox在线绘图工具可通过多种方法对数据进行降维处理,并生成可视化图片,您可以对比不同方法得到的结果,选择最满意的一种。
链接:https://www4.shbiochip.com/SBCToolBox/
进入后选择“点图”即可找到以上的工具。
什么是数据降维?
生物学数据往往是由许多特征组成的,比如基因的表达量。这些特征可以看作是数据的维度,而数据的维度越高,处理和分析数据的难度就越大。
数据降维方法会从原始数据中找到最重要的特征或者最能区分不同类别的特征,然后将数据在这些特征上进行投影。在投影的过程中,保留最重要的信息,舍弃掉一些次要的信息,将高维数据转换为低维数据。
降维过后即通过可视化的方式来展示样本之间的相似性和重复性。二维图片的两个坐标轴为降维后数据最重要的两个特征,图中每个样本都可以表示为一个点,点的位置和距离可以反映样本之间的相似性和差异性。
输入文件
画图需要上传定量数据和分组数据,格式如图:
定量数据
分组数据
生成结果
下面我们用不同方法对同一组数据进行降维,并可视化。示例数据样本被分为三组,图中点的颜色代表样本组别。生成的图片添加了置信椭圆,若不需要可在参数调整中取消。部分降维方法可选择距离计算方法,下方展示的均为默认参数下生成的结果。
1. PCA(Principal Component Analysis)
PCA,即主成分分析,通过线性变换,将原始的高维度数据转换为一组新的低维度数据,称为主成分。PCA能够最大程度地保留原始数据的方差,使得降维后的数据尽可能保留原始数据的信息。PCA适用于线性关系较强的数据。选取前两个主成分进行可视化。
2. PCA 3D
使用三个主成分,绘制交互式三维PCA图。
3. PCoA(Principal Coordinates Analysis)
PCoA,即主坐标分析,是一种基于距离矩阵的数据降维方法。PCoA通过保持样本之间的距离关系来进行降维,能够更好地反映样本之间的相似性和差异性。PCoA适用于非线性关系数据。
4. NMDS(Non-metric Multidimensional Scaling)
NMDS,即非度量多为排列,也是一种基于距离矩阵的数据降维方法。NMDS通过计算样本间的相异性来进行数值排序,生成的结果是样本在低维空间中的相对位置关系,而不是具体的数值。NMDS适用于非线性关系数据。
5. Sammon(Sammon’s Non-Linear Mapping)
Sammon映射是一种非线性降维方法,它通过最小化原始数据点与降维后的数据点之间的差异来进行降维。Sammon映射更加关注数据中的局部结构,能够更好地保留数据中的局部相似性。
6. Rtsne
Rtsne是基于t-SNE算法的一种非线性降维方法,对于复杂的非线性关系数据表现良好。Rtsne适用于存在聚类现象的数据,且对局部结构和相对距离的保留更为敏感。
总的来说,降维方法的选择取决于数据的特征和目标。您可以使用上述在线工具分别对数据进行降维并可视化,挑选其中最符合预期的一种。
SBC ToolBox共有七十余种在线绘图工具,包含条形图、线图、点图、热图、富集分析等多类功能,目前还在持续更新中,注册后即可免费绘制各种自定义图片,快来看看吧!
链接:
http://www4.shbiochip.com/SBCToolBox/
新闻中心
News Senter
上海生物芯片有限公司
Shanghai Biochip Co., Ltd.
版权所有©上海生物芯片有限公司
电子邮箱:
marketing@shbiochip.com
地址: 上海市浦东新区张江高科技园区李冰路151号
技术电话:
4001002131
扫描查看
微信公众号