Wancius_新浪博客

pandasmerge注意事项：on参数中的特征中的元素有重复值，merge后的行…

(2018-06-28 16:06)

分类： Python

pandas 的 join & merge 使用可参考：
https://www.cnblogs.com/bigshow1949/p/7016235.html

注意：
使用 pd.merge 的 on 参数时：当on参数中的特征中的元素有重复值，merge后的行数会增加。

阅读收藏

查看全文>>

pymnet 多层网络

(2017-09-27 10:12)

转载▼

标签：

多层网络

分类： Python

pymnet是python画多层网络图的一个模块。

pymnet模块主页：

http://mkivela.com/pymnet/index.html

http://mkivela.com/pymnet/tutorial.html

第一作者主页：http://www.mkivela.com/

文章：

https://academic.oup.com/comnet/article/2/3/203/2841130/Multilayer-networks

安装：

1. 下载源代码：

官网： https://bitbucket.org/bolozna/multilayer-networks-library/src

http://people.maths.ox.ac.uk/kivela/mln_library/installing.html

GitHub：https://github.com/tak-wah/Epidemic/tree/master/multilayer-networks-library

2. 运行： $ python setup.py install

示例：

http://mkivel

阅读收藏

查看全文>>

python，生成随机的十六进制颜色

(2017-07-13 17:31)

转载▼

分类： Python

import random

r = lambda: random.randint(0,255)

print('#XXX' % (r(),r(),r()))

import random

color ='#x' % random.randint(0,0xFFFFFF)

3. 生成随机 3字符颜色：

import random

color ='#x' % random.randint(0,0xFFF)

import random

chars = '0123456789ABCDEF'

['#'+''.join(sample(chars,6)) for i in range(N)]

from random import choice

color_sequence = ['#1f77b4', '#aec7e8', '#ff7f0e', '#ffbb78', '#2ca02c', '#98df8a', '#d62728', '#ff9896', '#9467bd', '#c5b0d5', '#

阅读收藏

查看全文>>

[转载]怎么利用DAVID做富集分析

(2017-06-21 15:04)

标签：

转载

分类： Biology

原文地址：怎么利用DAVID做富集分析作者：-爱小果冻-

DAVID对基因做富集分析

作为一只生信狗，基于很多算法去找到一些显著基因后，接下来想去看这些基因都影响了哪些功能，常见的就是GO功能注释和KE

阅读收藏

查看全文>>

Linux教程：如何查找并移除Ubuntu上陈旧的PPA仓库

(2017-02-17 16:08)

转载▼

分类： Ubuntu

1. [takwah@Tak-Wah 02:59:42 /home/takwah~$] sudo apt-get update

get:

W: Failed to fetch http://ppa.launchpad.net/ubuntu-wine/ppa/ubuntu/dists/trusty/main/binary-i386/Packages Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/ubuntu-wine/ppa/ubuntu/dists/trusty/main/i18n/Translation-en Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/wine/wine-builds/ubuntu/dists/trusty/main/binary-amd64/Packages Hash Sum mismatch

W: Failed to fetch http://ppa.launchpad.net/wine/wine-builds/ubuntu/dists/trusty/main/binary-i386/Packages Hash Sum mismatch

E: Some index files failed to download. They have been ignored, or old ones used instead.

2. 移除PPA仓库.

阅读收藏

查看全文>>

python字符串中连续相同字符个数

(2016-12-20 15:21)

转载▼

分类： Python

由字符TF组成的字符串，如：'TTFTTTFFFFTFFTT'能计算连续相同字符的个数，

eg1 返回：T2, F1, T3, F4, T1, F2, T2

eg2 返回：['TT', 'F', 'TTT', 'FFFF', 'T', 'FF', 'TT']

python 代码：

http://s4/mw690/0034p9I9zy77kTAJuX943

My example:

阅读收藏

查看全文>>

python 判断某个列表中的所有元素在另一个列表中

(2016-12-19 20:21)

转载▼

分类： Python

>>> list1 = ['a','b','c']

>>> list2 = ['d','b','c','a']

>>> set(list1).issubset(set(list2))

True

阅读收藏

查看全文>>

Linux根据一个文件的列内容提取另一个文件的行

(2016-11-06 15:12)

转载▼

分类： Shell

#!/bin/bash

cat SNP.txt | while read line;do

grep --color=auto '$line' AllChr.impute.vcf >> signSNPs.vcf

done

### 根据SNP.txt文件提取到AllChr.impute.vcf文件中含有其内容的行。

例如SNP.txt文件中chr16:53570243出现在AllChr.impute.vcf文件中行内容被写入signSNPs.vcf文件中。

http://s15/mw690/0034p9I9zy76cI7RG34ae

阅读收藏

查看全文>>

split命令分割文件，文件名称设置

(2016-11-04 20:50)

转载▼

分类： Shell

1、Linux里切割大文件的命令如下：

split [OPTION] [INPUT [PREFIX]]

选项如下：

-a : 指定后缀长度

-b : 每个文件多少字节

-d : 使用数字后缀而不是字母

-l : 指定每个文件的行数

2、比如我想让后缀长度为 2，即 -a 2。用数字后缀 -d。每个文件 10M，即 -b 10m。命令可以设计如下：

split -a 2 -d -b 10m OriginalFiles.log NewFiles.log

会在 /root 文件夹下生成下面的切割文件：

NewFiles.log00

NewFiles.log01

NewFiles.log02

......

然而，得到的文件名称并不令我满意，我的目标是：NewFiles_

阅读收藏

查看全文>>

Haploview需要导入数据的格式（linkage格式）详细介绍

(2016-09-22 15:09)

转载▼

分类： Biology

Haploview需要导入数据的格式（linkage格式）

Haploview的第一个主界面的linkage格式需要输入两个文件，点击左侧的Linkage Fofmat就会看到有两个导入文件的地方，一个是Data File，另一个是Locus Information File。下面详细的介绍一下这两个数据的格式，我们以Haploview自带的数据文件为例。在haploview安装的目录下（一般为C:\Program Files\HaploView）有两个数据文件：（1）sample.ped (2)sample.info。具体就是Data File处导入sample.ped文件，Locus Information File处导入sample.info数据。当然两个文件的扩展名你可以自己随意的起，Haploview有一个默认关联，即：如果你的两文件主要名称一样（比如chrom），扩展名分别为ped (chrom.ped)和info (chrom.info)，则只要导入ped文件，haploview会自动导入info

阅读收藏

查看全文>>