加载中…
个人资料
夸父逐梦
夸父逐梦
  • 博客等级:
  • 博客积分:0
  • 博客访问:87,597
  • 关注人气:13
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
访客
加载中…
好友
加载中…
评论
加载中…
留言
加载中…
分类
博文
标签:

杂谈

1.订阅号的需求文档

该文档是产品项目由“概念化”阶段进入到“图纸化”阶段的最主要的一个文档,其作用就是“对MRD中的内容进行指标化和技术化”,这个文档的质量好坏直接影响到研发部门是否能够明确产品的功能和性能。

产品需求文档(Product Requirement Document,PRD)的英文简称。是将商业需求文档(BRD)和市场需求文档(MRD)用更加专业的语言进行描述。

文档意义

该文档在产品项目中是一个“承上启下”的作用,“向上”是对MRD内容的继承和发展,“向下”是要把MRD中的内容技术化,向研发部门说明产品的功能和性能指标。

文档撰写

在该文档中,基点依然是MRD中的内容,只是把重心放在了“产品需求”上,而产品需求本身是在MRD中有所体现的,区别就是在于,PRD要把MRD中的“产品需求”的内容独立出来加以详细的说明。

这部分是PD写得最多的内容,也就是传统意义上的需求分析,我们这里主要指UC(use case)文档。主要内容有,功能使用的具体描述(每个UC一般有用例简述

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
解决方案:
drop table if exists heyf_t10; 
create table heyf_t10 (empid int ,deptid int ,salary decimal(10,2) );
insert into heyf_t10 values  
(1,10,5500.00), 
(2,10,4500.00), 
(3,20,1900.00), 
(4,20,4800.00), 
(5,40,6500.00), 
(6,40,14500.00), 
(7,40,44500.00), 
(8,50,6500.00), 
(9,50,7500.00); 
2. 确定需求: 根据部门来分组,显示各员工在部门里按薪水排名名次. 
显示结果预期如下: 
+-------+--------+----------+------+ 
| empid | deptid | salary | rank | 
+-------+--------+----------+------+ 
| 1 | 10 | 5500.00 | 1 |  
| 2 | 10 | 4500.00 | 2 |  
| 4 | 20 | 4800.00 | 1 |  
| 3 | 20 | 1900.00 | 2 |  
| 7 | 40 | 44500.00 | 1 |  
| 6 | 40 | 14500.00 | 2 |  
| 5 | 40 | 6500.00 | 3 |  
| 9 | 50 | 7
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
楼主由于长期在国外,想看国内电视就靠网络电视。尤其是安卓盒子,更加方便,不过由于网络原因,直播源靠自己测试编辑才稳定!以前只是搜集更大门户的不同直播源比较选择流畅的,但是这些源有的会反制,有的经常变化,所以只能靠自己逐渐摸索,学着写一些简单的代理。

看到最近很多朋友想学习写代理,其实论坛有很多前辈都贴出了很多教程,比如admin的教大家自己写简单的代理、absentfriend大大的继续发个cntv的超短proxy等 等。楼主也是根据本坛前辈们的帖子,慢慢自己摸索出来的。幸运的是,楼主虽然不是码农科班出身,但为了工作需要,还是有很丰富的编程经验,所以上手还算顺 利。现在能看到的趋势是,在行业逐渐规范的趋势下,版权意识更加深入人心,除了社会主义优越性决定的那些开放渠道,源肯定越来越难搞,楼主在将尽量把自己 觉得有用的跟大家分享。当然,本坛里卧虎藏龙,高手云集,也希望前辈们多多指教,毕竟都是从小白过来的嘛
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
这里所谓的代理  就是通过php小程序来帮你抓取动态的播放地址
我们一成都电视台的为例讲解一下
成都电视台的网址是http://www.cditv.cn/show-192-1-1.html  右键  查看源码
我们可以看到下面这么一段代码
  1.         
复制代码
这就是播放地址   当然这个播放地址是动态的  那么怎么通过php来实时的抓取他呢
我先贴出代码  然后在一句句解释
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
http://jingyan.baidu.com/article/1612d50079cfe5e20f1eee71.html

测试tomcat能不能启动 启动tomcat: service tomcat start
测试tomcat能不能停止 停止tomcat:  service tomcat stop
 
启动方式中该服务是启动 #chkconfig tomcat on  
#chkconfig --list tomcat

阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

转载

第一:应用函数
<?xml version='1.0' encoding='utf-8'?>
<xsl:stylesheet version='1.0'
    xmlns:xsl='http://www.w3.org/1999/XSL/Transform'
 xmlns:msxsl='urn:schemas-microsoft-com:xslt'
 xmlns:user='http://mycompany.com/mynamespace'>

 <msxsl:script language='JScript' imp
阅读  ┆ 评论  ┆ 转载原文 ┆ 收藏 
分类: 网络爬虫
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

tika

分类: 网络爬虫

简介

在本教程中,我们将通过解释性的例子介绍 Apache Tika 框架并解释它的概念(比如 N-gram、解析、mime 检测以及内容分析),这些例子不仅适用于老练的软件开发人员,而且也同样适用于内容分析和编程的初学者。我们假设您具有 Java™ 编程语言的应用知识以及用于分析的足够内容。

通过本教程,您将学会:

  • Apache Tika 的 API、最相关的模块以及相关的函数
  • Apache Nutch (Tika 的先驱之一)以及它的 NgramProfiler 和 LanguageIdentifier 类,它们最近被移植到了 Tika
  • 代码页检测器项目 cpdetector 及其功能

什么是 Apache Tika?

正如 Apache Tika 的网站上介绍的,Apache Tika 是一个工具箱,用来通过现有的解析器库检测以及从各种文档提取元数据以及结构化的文本内容。

解析器接口

org.apache.tika.parser.Parser 接口是 Apache Tika 的关键组件。它隐藏了不同文件格式和解析库的复杂性,而同时又为客户应用程序从各种不同的文档提取结构化的文本内容以及元数据提供了一个简单且功能强大的机制。所有这些都是通过一个简单的方法实现的:

 void parse(In
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

it

分类: 网络爬虫
1,网络机器人Java编程指南,浅显易懂,有点过时,但适合新手
2,自己动手写网络爬虫,有点基础还可以看看,写的有点乱,很多内容交代不清楚,并且大篇幅代码抄袭。。。
3,搜索引擎 ——原理、技术与系统,北大天网为案例,很好很强大,有点学术味道
4,Web数据挖掘  Bing Liu,刘兵的书,强烈推荐
5,搜索引擎:信息检索实践,很好的书,强烈推荐
还有一些论文,自己去找吧
案例的话,可以研究下Nutch爬虫部分代码,写的很清晰
有了以上这些,应该算是入门了
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有