加载中…
  
博文
分类: Python
pandas 的 join & merge 使用可参考:
https://www.cnblogs.com/bigshow1949/p/7016235.html

注意:
使用 pd.merge 的 on 参数时:当on参数中的特征中的元素有重复值,merge后的行数会增加。
(2017-09-27 10:12)
标签:

多层网络

分类: Python

pymnet是python画多层网络图的一个模块。

pymnet模块主页:

http://mkivela.com/pymnet/index.html

http://mkivela.com/pymnet/tutorial.html​

第一作者主页:http://www.mkivela.com/​

文章:

https://academic.oup.com/comnet/article/2/3/203/2841130/Multilayer-networks​

安装:

1. 下载源代码:

官网: https://bitbucket.org/bolozna/multilayer-networks-library/src​​

           http://people.maths.ox.ac.uk/kivela/mln_library/installing.html

GitHub:https://github.com/tak-wah/Epidemic/tree/master/multilayer-networks-library

2. 运行: $ python setup.py install

示例:

​http://mkivel

分类: Python

1.

import random

r = lambda: random.randint(0,255)

print('#XXX' % (r(),r(),r()))


2.

import random

color ='#x' % random.randint(0,0xFFFFFF)

3. 生成随机 3字符颜色:

import random

color ='#x' % random.randint(0,0xFFF)

4.

import random

chars = '0123456789ABCDEF'

['#'+''.join(sample(chars,6)) for i in range(N)]


5.

from random import ​choice

color_sequence = ['#1f77b4', '#aec7e8', '#ff7f0e', '#ffbb78', '#2ca02c', '#98df8a', '#d62728', '#ff9896', '#9467bd', '#c5b0d5', '#

标签:

转载

分类: Biology
DAVID对基因做富集分析

作为一只生信狗,基于很多算法去找到一些显著基因后,接下来想去看这些基因都影响了哪些功能,常见的就是GO功能注释和KE
分类: Ubuntu

1. [takwah@Tak-Wah 02:59:42 /home/takwah~$] sudo apt-get update

get:

W: Failed to fetch http://ppa.launchpad.net/ubuntu-wine/ppa/ubuntu/dists/trusty/main/binary-i386/Packages  Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/ubuntu-wine/ppa/ubuntu/dists/trusty/main/i18n/Translation-en  Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/wine/wine-builds/ubuntu/dists/trusty/main/binary-amd64/Packages  Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/wine/wine-builds/ubuntu/dists/trusty/main/binary-i386/Packages  Hash Sum mismatch

E: Some index files failed to download. They have been ignored, or old ones used instead.​

2. 移除PPA仓库​.

[t

分类: Python

由字符TF组成的字符串,如:'TTFTTTFFFFTFFTT'能计算连续相同字符的个数,

eg1   返回:T2, F1, T3, F4, T1, F2, T2

eg2   返回:['TT', 'F', 'TTT', 'FFFF', 'T', 'FF', 'TT']

python 代码:​

My example:

分类: Python

>>> list1 = ['a','b','c']

>>> list2 = ['d','b','c','a']

>>> set(list1).issubset(set(list2))

True


分类: Shell

#!/bin/bash

cat SNP.txt | while read line;do

grep --color=auto '$line' AllChr.impute.vcf >> signSNPs.vcf

done

### 根据SNP.txt文件提取到AllChr.impute.vcf文件中含有其内容的行。

例如SNP.txt文件中chr16:53570243出现在AllChr.impute.vcf文件中行内容被写入signSNPs.vcf文件中。

分类: Shell

1、Linux里切割大文件的命令如下:

split [OPTION] [INPUT [PREFIX]] 

选项如下:

-a : 指定后缀长度

-b 每个文件多少字节

-d 使用数字后缀而不是字母

-l 指定每个文件的行数

2、比如我想让后缀长度为 2,即 -a 2。用数字后缀 -d。每个文件 10M,即 -b 10m。命令可以设计如下:

split -a -d -b 10m OriginalFiles.log NewFiles.log

会在 /root 文件夹下生成下面的切割文件:

NewFiles.log00 

NewFiles.log01 

NewFiles.log02 

......

然而,得到的文件名称并不令我满意,我的目标是:NewFiles_

分类: Biology

Haploview需要导入数据的格式(linkage格式)

Haploview的第一个主界面的linkage格式需要输入两个文件,点击左侧的Linkage Fofmat就会看到有两个导入文件的地方,一个是Data File,另一个是Locus Information File。下面详细的介绍一下这两个数据的格式,我们以Haploview自带的数据文件为例。在haploview安装的目录下(一般为C:\Program Files\HaploView)有两个数据文件:(1sample.ped (2)sample.info 具体就是Data File处导入sample.ped文件,Locus Information File处导入sample.info数据。当然两个文件的扩展名你可以自己随意的起,Haploview有一个默认关联,即:如果你的两文件主要名称一样(比如chrom),扩展名分别为ped (chrom.ped)info (chrom.info),则只要导入ped文件,haploview会自动导入info

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有