三维基因组: SELFISH 差异分析
moboyou 2025-05-16 17:49 26 浏览
引言
本系列主要讲解 3D-Genome (Hi-C) 系列的分析,主要涉及三维基因组分析中的数据处理,重复性评估,Compartment/TAD/Loop 检测,差异分析等,欢迎关注!
SELFISH
SELFISH[1] 是一款用于检测 Hi-C 矩阵间差异相互作用的软件,支持 MATLAB 和 Python。
原理
基于矩阵间局部自相似性原理。如果矩阵 A 和 B 之间,基因组 bin_i 和 j 的相互作用接触频率存在显著差异,那么这种差异在该相互作用周围的像素(即“影响半径”)内仍会显著。为了降低远离测试相互作用的相互作用的影响,会以 i, j 为中心,对影响半径施加一个逐渐增大的高斯滤波器。同时,由于基因组位点的线性邻近性和布朗运动,大多数相互作用发生在矩阵对角线附近,因此会根据与对角线的接近程度对相互作用进行归一化处理。最终,每个相互作用用一组向量表示,这些向量包含其邻近相互作用在不同影响半径下的频率,而这组向量的一阶导数将用于检测矩阵 A 和 B 之间的差异。
Example
本文讨论的 SELFISH 的 Python 版本是一个命令行工具,可接受 .hic、. cool 和 HiC-Pro 矩阵作为输入。它输出的文件格式有两种:一种是 numpy 格式的差异相互作用概率 p 值矩阵;另一种是更易读的制表符分隔文件,其中包含两个差异相互作用 bin 的起始坐标、p 值以及差异相互作用的对数变化倍数(logFC)。
SELFISH 的运行命令如下:
selfish -f1 HiC_Rep1.hic -f2 HiC_Rep1.hic -ch chr2 -r 5kb -o SELFISH_chr2_5kb_D00vsD15.tsv -t 0.05
在这里,-f1 和 -f2 是需要分析的矩阵,-ch 和 -r 是从 .hic 文件中提取的染色体和分辨率,-t 参数用于指定输出结果为制表符分隔文件,同时设置记录结果的 p 值阈值(此处设定得较为宽松,<0.05,后续可以对结果进行进一步筛选),而 -o 参数则用于指定结果文件的路径和文件名。尽管可以通过参数 -p 绘制每个染色体的差异相互作用图,但对于分辨率更高的分析(例如,bin 尺寸小于 50 kb),强烈不推荐使用此选项。
在将结果转换为 R 中的 .bedpe 格式后,SELFISH 的结果可以在 JuiceBox 中轻松可视化:
# R version 3.6.2
options(scipen=999)
bin.size <- 5000
pval_threshold <- 0.01
logFC_threshold <- 1
chrs <- c("chr1","chr2","chr3","chr4","chr5","chr6","chr7","chr8","chr9","chr10","chr11","chr12","chr13","chr14","chr15","chr16","chr17","chr18","chr19","chr20","chr21","chr22","chrX")
all_interactions <- NULL
for (chr in chrs) {
print(chr)
diffInts <- read.table(paste("SELFISH", chr, "D00vsD15_5kb.tsv",sep="_"), sep= "\t", header= T, stringsAsFactors= F)
diffInts_filtered <- diffInts[diffInts$P_VAL < pval_threshold & (diffInts$LOG_FOLD_CHANGE > logFC_threshold | diffInts$LOG_FOLD_CHANGE < -(logFC_threshold)),]
Nrow <- nrow(diffInts_filtered)
diffInts_filtered_bedpe <- data.frame(
"chr1"= rep(chr, Nrow),
"chr1_bin_start"= diffInts_filtered$LOC1, "chr1_bin_end"= diffInts_fil-
tered$LOC1 + bin.size,
"chr2"= rep(chr, Nrow),
"chr2_bin_start"= diffInts_filtered$LOC2,
"chr2_bin_end"= diffInts_filtered$LOC2 + bin.size,
"name"= rep(".", Nrow),
"score"= rep(".", Nrow),
"strand1"= rep(".", Nrow),
"strand2"= rep(".", Nrow),
"color"= rep("0,255,255", Nrow),
"p_value"= diffInts_filtered$P_VAL,
"logFC"= diffInts_filtered$LOG_FOLD_CHANGE, stringsAsFactors=F)
all_interactions <- rbind(all_interactions, diffInts_filtered_bedpe, stringsAsFactors=F)
}
all_interactions_noEmpty <- all_interactions[!is.na(all_interactions$p_value),]
# RGB color code for dark blue
all_interactions_noEmpty[all_interactions_noEmpty$logFC>0,11] <- "0,0,139"
# RGB color code for orange
all_interactions_noEmpty[all_interactions_noEmpty$logFC<0,11] <- "255,140,0"
write.table(all_interactions_noEmpty, "SELFISH_D00vsD15_5kb.bedpe", sep= "\t", col.names= F, row.names= F, quote=F)
在这个过程中,通过 bin. size 设置分辨率,并利用 pval_threshold 和 logFC_threshold 来确定 p 值和 logFC 的阈值,以便筛选出符合条件的相互作用。使用 read. table 函数读取 SELFISH 输出的 .tsv 文件,然后根据设定的 p 值阈值(<0.01)和对数变化倍数阈值(logFC >1 或 < -1)对相互作用列表进行筛选。为了使结果符合 .bedpe 格式,还添加了名称、得分、strand1、strand2 和相互作用颜色列。最后,根据对数变化倍数的正负,调整相互作用的颜色,并通过 write. table 函数将筛选后的差异相互作用以 .bedpe 格式保存到一个制表符分隔文件中。根据这些阈值,SELFISH 在染色体 2 上共发现了 169,703 个差异相互作用。
[1]Github: https://github.com/ucrbioinfo/Selfish
- 上一篇:电力EI会议,高录用技巧公开!
- 下一篇:JECE审稿意见太狠如何回复?
相关推荐
- CentOS、Nginx、PHP、MySQL的安装和配置记录
-
安装LNMP安装wget工具(可选) yuminstall-ywget下载Nginx wgethttp://www.atomicorp.com/installers/ato...
- phpstudy安装及简单使用教程(phpstudy pro怎么安装)
-
phpstudy前不久爆出有后门,我的看法是,去看下是哪个版本有后门,为啥会有后门,怎么解决掉这个后门,而不是听到后门就弃用了。毕竟phpstudy绿色安装,配置简单,多版本融合,真香。前言:关于开发...
- PHP 语法详解(php方法大全)
-
PHP脚本在服务器上执行,然后向浏览器发送回纯HTML结果。基础PHP语法PHP脚本可放置于文档中的任何位置。PHP脚本以<?php开头,以?>结尾:<?php...
- 简单一点 全网页截图不难(网页截图如何截完整的)
-
很多人看到好的网页想要截图,比如看到一个全屏幕网页很好,想要截取下来保存,无论如何都是快捷键或者Windows自带的截图工具无法实现的,通常方法都是安装专用的截图软件,占用系统空间不说,专业的软件操作...
- PHP分享(php分享IPTV单播步骤详解和注意事项)
-
第一次接触PHP,这是我做的输出和符不符合条件,第三个我忘记叫什么了,对这个还不太熟悉,要勤加练习。左边是代码,右边是效果图。我在做的时候出现最多的错误就是符号,写代码一定要切记是在英文状态下写不是在...
- PHP站点要这样配置服务器才安全(php 服务器配置)
-
主机(站点)配置一个站点的2个核心信息为:主机名(服务器名/站点名):ServerName服务器名站点位置(站点目录路径):DocumentRoot“实际物理路径”默认情况下,apache安装...
- 从零学习php之php语法——课程1(php教程200课程)
-
以后将会每天更新一篇电脑编程教程有需要的朋友记得订阅转发哟怎么学习php?对于想学php还没入门的朋友很多都在纠结怎么开始第一步。我很了解php初学者的心理,因为我也是从那个阶段过来的,也是自学。那...
- 为什么使用PHP制作网站?(php为什么可以开发动态网页)
-
现在网站制作可以使用多种语言。为什么我们选择PHP进行网站制作?北京东浩联创科技有限公司.是一家高端网站制作公司,在业界处于领先地位。本文东浩联创的小编告诉大家我们为什么使用PHP进行网站制作?它的...
- 更新:PHP 8.2.11(64位)(更新:PHP 8.2.11(64位破解)
-
最新版本:PHP8.2.11(64位)最新消息:WindowsXP64/Vista64/Windows764/Windows864/Windows1064/Wind...
- 常见的PHP五大运行模式详解(php运行需要哪些核心程序)
-
1)CGI(通用网关接口/CommonGatewayInterface)2)FastCGI(常驻型CGI/Long-LiveCGI)3)CLI(命令行运行/CommandLineI...
- 常见36种WEB渗透测试漏洞描述及解决方法---phpinfo信息泄露
-
漏洞描述:测试页面可能会使用到PHP的phpinfo()函数输出服务器重要信息,造成信息泄露,为后续攻击提供可能。解决方法:删除相关PHP文件。...
- 跨境电商独立站必做!隐藏PHP版本的小秘密
-
你知道吗?黑客攻击独立站的第一步,往往是“侦察”。就像小偷会先踩点一样,他们会扫描你的服务器信息,而暴露的PHP版本就是最显眼的“漏洞地图”。有个卖家居的跨境卖家曾跟我吐槽:“网站莫名其妙被注入恶意代...
- 对不起,您访问的页面不存在!(出错啦!你访问的页面不存在...)
-
可能因为:网址有错误>请检查地址是否完整或存在多余字符网址已失效>可能页面已删除,活动已下线等...
- php搭建小型部门网站(php建一个网站步骤)
-
熟悉前端html,js,css,后端熟悉php,python,java只能称得上一般,还有很多坑待踩。鉴于所学很杂,决定利用对业务的熟悉来搞一个部门网站来简化大家的工作流程。初步设计方案后端用p...
- 如何知道网站是否用PHP语言编写的
-
最近一段时间,有好多朋友问我,这个商城是不是用的PHP程序,那个网站用的是不是PHP程序,特别是刚入行的新人,那么如何判断一个网站是不是用语言写的,这还真是个问题,那么今天我就以我的经验写一下通过网...
- 一周热门
- 最近发表
- 标签列表
-
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle两个表 (20)
- oracle 数据库 字符集 (20)
- oracle安装补丁 (19)
- matlab化简多项式 (20)
- 多线程的创建方式 (29)
- 多线程 python (30)
- java多线程并发处理 (32)
- 宏程序代码一览表 (35)
- c++需要学多久 (25)
- css class选择器用法 (25)
- css样式引入 (30)
- css教程文字移动 (33)
- php简单源码 (36)
- php个人中心源码 (25)
- php小说爬取源码 (23)
- 云电脑app源码 (22)
- html画折线图 (24)
- docker好玩的应用 (28)
- linux有没有pe工具 (34)
- mysql数据库源码 (21)