linux系统mount出现"结构需要清理"的解决方案

(2019-01-03 12:25)

1首先出现'结构需要清理'说明磁盘文献问题,需要使用以下命令进行检查

fsck /dev/sda4(磁盘路径,可以使用fdisk -l 查看所有设备使用情况)

2 再次使用mount 命名进行挂载,即可挂载成功

阅读收藏

查看全文>>

python+opencv基于内容的图片搜索

(2018-09-18 14:22)

转载▼

内容来自:https://blog.csdn.net/coderhuhy/article/details/46575667

简单介绍一下OpenCV。

OpenCV was designed for computational efficiency and with a strong focus on real-time applications. Written in optimized C/C++, the library can take advantage of multi-core processing. Enabled with OpenCL, it can take advantage of the hardware acceleration of the underlying heterogeneous compute platform. Adopted all around the world, OpenCV has more than 47 thousand people of user community and estimated number of downloads exceeding 9 million. Usage ranges from interactive art, to mines inspection, stitching maps on the web or through advanced robotics.

OpenCV（Open Source Computer Vision Library）的计算效率很高且能够完成实时任务。OpenCV库由优化的C/C++代码编写而成，能够

阅读收藏

查看全文>>

结合Scikit-learn介绍几种常用的特征选择方法

(2018-02-02 17:23)

转载▼

特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。

特征选择主要有两个功能：

减少特征数量、降维，使模型泛化能力更强，减少过拟合
增强对特征和特征值之间的理解

拿到数据集，一个特征选择方法，往往很难同时完成这两个目的。通常情况下，我们经常不管三七二十一，选择一种自己最熟悉或者最方便的特征选择方法（往往目的是降维，而忽略了对特征和数据理解的目的）。

在许多机器学习相关的书里，很难找到关于特征选择的内容，因为特征选择要解决的问题往往被视为机器学习的一种副作用，一般不会单独拿出来讨论。

本文将结合Scikit-learn提供的例子介绍几种常用的特征选择方法，它们各自的优缺点和问题。

1 去掉取值变化小的特征 Removing features with low variance

这应该是最简单的特征选择方法了：假设某特征的特征值只有0和1，并且

阅读收藏

查看全文>>

“做项目”与“做产品”的区别是什么

(2017-08-18 12:54)

转载▼

标签：

产品

项目

分类：产品管理

首先，我们还是先了解项目管理和产品管理的基本概念。

什么是项目?

项目是在限定的资源及限定的时间内需完成的一次性任务。具体可以是一项工程、服务、研究课题及活动等。作为项目来说，无论是什么类型的项目，都具有启动、计划、执行、收尾四个阶段。这四个阶段可以存在于产品生命周期的任何一个阶段。

什么是项目管理?

指在项目活动中运用专门的知识、技能、工具和方法，使项目能够在有限资源限定条件下，实现或超过设定的需求和期望的过程。项目管理是对一些与成功地达成一系列目标相关的活动(譬如任务)的整体监测和管控。

什么是产品?

产品是指能够提供给市场，被人们使用和消费，并能满足人们某种需求的任何东西，包括有形的物品、无形的服务、组织、观念或它们的组合。具体针对软件来说，作为产品主要关注的软件的功能是否满足客户需要。而作为项目，软件功能满足客户需要只是项目管理中“范围、时间、成本、质量”四大因素中的一部分，而且只是属于“范围”和“质量”的一部分。作为项目还要考虑时间和进度的把控。

什么是产品管理?

阅读收藏

查看全文>>

SAS 日期函数操作

(2015-12-16 14:20)

转载▼

1.基本设置

(1)SAS中用数值来表示日期，SAS日期值等于具体日期离1960/1/1天数。

eg:

date SAS value

1959-1

阅读收藏

查看全文>>

机器学习过度拟合问题一些原因

(2013-04-15 10:54)

转载▼

这几天在训练一个文本处理的机器学习算法，使用支持向量机和决策树算法在训练集上的数据的准确度特别高，但是在测试集上的数据的准确度确很低，于是陷入过度拟合的烦恼中，查找资料发现一些多度拟合的看法。仔细想想确实在训练时存在一些问题，第一：输入变量多，由于缺乏对问题的根本认识，使用了很多无关变量，这个问题打算从其它途径先认识变量和问题的关系；第二：数据的噪声可能是比较大，没有考虑到关键的特征和信息。下面的几段文字是一些关于多度拟合的认识：

过度拟合（overfitting）是指数据模型在训练集里表现非常满意，但是一旦应用到真实业务实践时，效果大打折扣；换成学术化语言描述，就是模型对样本数据拟合非常好，但是对于样本数据外的应用数据，拟合效果非常差。在我们数据分析挖掘业务实践中，就是“模型搭建时表现看上去非常好，但是应用到具体业务实践时，模型效果显著下降，包括准确率、精度、效果等等显著下降”。

我自己见识有限，目光短浅，无法穷举主要的原因和避免的方法，只能班门弄斧，抛砖引玉，说说我自己的一孔之见了，期待各位的指正和增补，我给各位献丑了。

过拟合的第一个原因，就是建模

阅读收藏

查看全文>>

C4.5决策树以及过度拟合问题

(2013-04-08 15:44)

转载▼

C4.5决策树在ID3决策树的基础之上稍作改进，请先阅读

阅读收藏

查看全文>>

终于找到R语言编辑器了

(2013-04-08 14:05)