加载中…
个人资料
新技术笔记
新技术笔记
  • 博客等级:
  • 博客积分:0
  • 博客访问:409,794
  • 关注人气:197
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
博文
(2014-04-15 17:21)
标签:

杂谈

分类: 技术荟萃

分治算法

一、基本概念

   在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)……

    任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小,越容易直接求解,解题所需的计算时间也越少。例如,对于n个元素的排序问题,当n=1时,不需任何计算。n=2时,只要作一次比较即可排好序。n=3时只要作3次比较即可,…。而当n较大时,问题就不那么容易处理了。要想直接解决一个规模较大的问题,有时是相当困难的。


二、基本思想及策略

   分治法的设计思想是:将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。

   分治策略是:对于一

标签:

杂谈

分类: 技术荟萃

为什么选择跳表

目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等。

想象一下,给你一张草稿纸,一只笔,一个编辑器,你能立即实现一颗红黑树,或者AVL树

出来吗? 很难吧,这需要时间,要考虑很多细节,要参考一堆算法与数据结构之类的树,

还要参考网上的代码,相当麻烦。

用跳表吧,跳表是一种随机化的数据结构,目前开源软件 Redis 和 LevelDB 都有用到它,

它的效率和红黑树以及 AVL 树不相上下,但跳表的原理相当简单,只要你能熟练操作链表,

就能轻松实现一个 SkipList。

有序表的搜索

考虑一个有序表:

clip_image001

标签:

杂谈

分类: 丰富多彩
 很简单,在“视图”选项中,勾选上“标尺”,然后标尺栏上有一个小三角箭头,拖动它就能调整了! 
标签:

ppt

杂谈

分类: 技术荟萃

制作PPT时,经常拷贝一些PPT的图案、文字过来,有时候颜色、格式会发生变化。如何保持原样呢?解决方案很简单!Office的功能仍是这么完备,可是为什么要默认颜色改变呢?这个没想明白。

解决办法:在你复制的幻灯片旁边有一个粘贴选项,选中里面的保留原格式就行。如图。



标签:

百分号编码

urlencode

杂谈

分类: 技术荟萃

百分号编码(Percent-encoding), 也称作URL编码(URL encoding), 是特定上下文的统一资源定位符 (URI)的编码机制. 实际上也适用于统一资源标志符(URI)的编码. 也用于为'application/x-www-form-urlencoded' MIME准备数据, 因为它用于通过HTTP的请求操作(request)提交HTML表单数据.

URI的百分号编码

URI的字符类型

URI所允许的字符分作保留未保留. 保留字符是那些具有特殊含义的字符. 例如, 斜线字符用于URL (或者

标签:

降维

特征抽取

特征选择

线性相关

互信息

it

分类: 数据挖掘
  特征降维(feature dimension reduction)是一个从初始高维特征集合中选出低维特征集合,以便根据一定的评估准则最优化缩小特征空间的过程,通常是机器学习的预处理步骤。当面临高维数据时,特征降维对于机器学习任务非常必要,通过降维有效地消除无关和冗余特征,提高挖掘任务的效率,改善预测精确性等学习性能,增强学习结果的易理解性。

1、降维概述
  通常,高维特征集合存在以下几方面问题:
  •大量的特征;
  •许多与给定任务无关的特征,即存在许多与类别仅有微弱相关度的特征;
  •许多对于给定任务冗余的特征,如特征相互之间存在强烈的相关度;
  •噪声数据。
  特征降维,可以分为特征抽取和特征选择两种方式。特征抽取涉及到语义上的分析,而目前自然语言语义处理技术尚不发达,用特征抽取方法进行特征降维的效果并不显著。相比之下,特征选择选出的特征集合是原始特征集的子集,所以更易实现,方法也更加多样,典型的有DF、IG、MI、CHI。

  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有