加载中…
博文
标签:

python

networkx

复杂网络

it

分类: python

http://blog.sciencenet.cn/home.php?mod=space&uid=404069&do=blog&classid=141080&view=me&from=space

复杂网络分析库NetworkX学习笔记(1):入门

NetworkX是一个
阅读  ┆ 转载 ┆ 收藏 
标签:

贝叶斯

it

分类: MachineLearning
在Andrew Ng的第五讲中讲到,贝叶斯分类方法中,先验分布是高斯分布或者泊松分布,那么后验分布都是logistic的函数形式,那么,当我们不太确定先验分布的形式,那么对二元分类时用logistic分类是很好的。所以高斯分布的形式在机器学习中的分布假设非常重要,也是很多表象形式和本质之间的桥梁,比如损失函数定义为差值平方和就是因为残差是服从高斯分布的原因,当然这里还有一个MLE的应用。
更一般的就是当先验分布是服从指数族分布的时候,后验分布都是logistic函数
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

it

分类: MachineLearning
Andrew Ng有关于他的导师经常比较喜欢的局部加权线性回归的问题(非参数算法)。
http://v.163.com/movie/2008/1/E/B/M6SGF6VB4_M6SGHM4EB.html
对于线性回归中,通过残差最小化进行函数拟合时,可以对损失函数进行变形,因为可能对某一个新值进行预测的时候,他仅仅与相近的域值关系很大,与其他的域值关系很小,所以可以把损失函数改写为:
Sum[w^(i)*(y^(i)-T(Thelta)*x^(i))^2,i]
其中w^(i)=Exp[-(x^(i)-x)^2/(2*tau)],按x^(i)与x接近时,w^(i)趋向于1;x^(i)与x远离时,w^(i)趋向于0

当然这个方法有几个弊端
1.对每个新的x都要重新进行拟合,代价较大,但是可以通过看Andrew Moore关于KD tree的研究工作了解对其的高效算法。
2.同样会出现欠拟合和过拟合现象
3.权重函数形式和tau值定的很随意,还没有进行较好的研究

注记:为什么新浪微博的创作窗口不能直接进行数学文档的编写?
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

gradientdescent

大数据

分类: MachineLearning
本节内容来自于Andrew Ng讲解的C229 lesson 2 斯坦福大学的网易视频课(监督学习应用)

对N个样本集合
文中最loss function J(thelta)一个最优化的方法是梯度下降方法,一般的策略是:
Batch Gradient Descent:

但是,对N是很大的情况,收敛的速度相当的慢;所以又有一种新的策略,就是:
Stochastic Gradient Descent:
for j=1 to N
{
 f
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

python

vim

linux

分类: python
下载地址:http://www.vim.org/scripts/script.php?script_id=850,各种版本可以自己选择,我选的是最新版本pydiction-1.2.1

可以实现下面python代码的自动补全:
  1. 简单python关键词补全
  2. python 函数补全带括号
  3. python 模块补全
  4. python 模块内函数,变量补全
  5. from module import sub-module 补全

以下的步骤是可以从下载的文件夹中的readme看到的

pydiction 的安装

pydiction 1.0 之前就不用再使用了,有新的为什么不用呢?

1.python_pydiction.vim

 

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

gfs

mapreduce

bigtable

hoodop

it

分类: CS
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

python

string

it

分类: python

http://www.skymind.com/~ocrow/python_string/

Efficient String Concatenation in Python

An assessment of the performance of several methods

Introduction

Building long strings in the Python progamming language can sometimes result in very slow running code. In this article

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

winxp

win7

ubuntu

装系统

卸载

分类: CS

http://hi.baidu.com/kane_lee/item/9e7c5671bd5e9340ef1e53d3


在winXp/win7系统下安装Ubuntu后,如果想卸载Ubuntu,在删除Ubuntu时,需要注意的地方就是MBR(Master Boot Record)。在删除Linux分区前,我们需要将启动Windows的引导信息写入MBR,否则,失去了MBR中的Linux引导信息,当然就不能启动Windows系统了。写入MBR,有两种比较简单:


    阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
    标签:

    mysql

    python2.6

    it

    分类: python
    最近要使用数据库,师兄推荐使用MySQL,然后就像在python 2.6下安装MySQLdb的包,遇到python版本低导致的问题,主要是在2.6.X版本的sets模块的缺失,但是相应的MySQLdb却是还没有做相应的修改。在网上找了好多资料,都说是把网络上下载的libmmd.dll,libguide40.dll以及mysql安装目录的bin\libmySQL.dll文件复制到
    阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
    标签:

    python

    scipy

    numpy

    pylab

    it

    分类: python

    SciPy函数库在NumPy库的基础上增加了众多的数学、科学以及工程计算中常用的库函数。例如线性代数、常微分方程数值求解、信号处理、图像处理、稀疏矩阵等等。由于其涉及的领域众多、本书没有能力对其一一的进行介绍。作为入门介绍,让我们看看如何用SciPy进行插值处理、信号滤波以及用C语言加速计算。
    假设有一组实验数据(x[i], y[i]),我们知道它们之间的函数关系:y = f(x),通过这些已知信息,需要确定函数中的一些参数项。例如,如果f是一个线型函数f(x) = k*x+b,那么参数k和b就是我们需要确定的值。如果将这些参数用 
    阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
    个人资料
    渔婆的愚公
    渔婆的愚公
    • 博客等级:
    • 博客积分:0
    • 博客访问:99,615
    • 关注人气:14
    • 获赠金笔:0支
    • 赠出金笔:0支
    • 荣誉徽章:
    访客
    加载中…
    好友
    加载中…
    评论
    加载中…
    留言
    加载中…
      

    新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有