加载中…
个人资料
rosewell
rosewell
  • 博客等级:
  • 博客积分:0
  • 博客访问:4,328
  • 关注人气:1
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
分类
博文
标签:

育儿

文化

教育

本人是红楼迷,且是姑娘,如今又是姑娘的娘。自我心灵探索和育儿精细化的双重时代到来,再读红楼,开卷有异,从前被年少无知忽略的主题维度——姑娘家的家教,突然徐徐展开。

这亦是红楼的神奇之处:横看成岭侧成峰,远近高低各不同。

废话少说,先上永世的钗黛之争。比赛之前,得先定裁判规则。姑娘家的家教如何算好?我以为有三个层次:第一是才情;第二是情商,也就是做人懂分寸;但最最重要的还是第三条:有一颗善良的心灵。

好,按这个规则来比。才情,钗黛算打平手。黛玉灵致,宝钗高远。黛玉有“孤标傲世皆谁隐,一样花开为底迟”;宝钗有“好风凭借力,送我上青云”。

再说情商呢?大概不少人看到这两个字,已经判定林妹妹准输。

其实大大不然。书中说宝姐姐做人比林妹妹好,无非有三个人的言论之考:一个老太太,那是自谦;一个赵姨娘,那是愚昧;还有一个是湘云,那,我看多半是捻酸吃味。倒是旁人对她俩的态度:李纨对林妹妹素来怜惜,探春对黛玉明显比对宝钗亲近,宝钗的亲妹子宝琴与黛玉一见如故,就连自视甚高的妙玉,吃体己茶也是钗黛双请,不分伯仲。可见林妹妹虽小性儿,单只冲着宝玉
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
先来点题外话,这个click model可不是平面模特儿。若是以其为主题词(term)来google的话,必须选择scholar搜索,否则难以找到与我们所期待的这个查询(query)串背后的真正用户意图(intent)相关的结果——无论付费(sponsored)的还是有机(organic)算法的——关于这一点我们后面也会专门讨论。说到这里,又产生另一问题,虽说选择学术搜索会返回点击模型相关的学术论文(还可以包括专利),但毕竟只限于论文及其索引相关等内容。若是我们想搜索点击模型相关的普通Web页面内容,例如本博客文章(我是说如果是英文的点击模型博文的话),通用搜索该如何设定查询词才能搜索到啊?

言归正传,不想循序渐进的一步步展开,上来就想直接谈谈点击模型的最大挑战及其对策(若对策一时比较难以给出,则容提出问题后再另行讨论):

第一大挑战莫过于俗称“冷启动”问题,即新查询and/or新广告的点击预测问题。一般是借助与已有足够点击反馈数据的查询and/or广告进行特征比较学习以期抓住其中规律,从而实现对新(或rare)查询/广告的点击预测。

第二大挑战就是所谓position bias问题造成
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

杂谈

游戏(Game)

游戏
G由下列三部分构成:
  1. 玩家(player)集合P;
  2. 对于每一玩家p属于P,都定义有一套非空动作(action)集合A_p;
  3. 对于每一玩家p属于P,都定义有一个从所有可能动作组合集合(即所有A_p的差乘)*A_p到实数集R上的回报(payoff)函数f_p。

*A_p中的向量a称为游戏G的Nash均衡(equilibrium),若对于任何p和a_p属于A_p,都存在:

f_p(a) >= f_p(a_p,a_-p).



阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

杂谈

蔡志明
原载《经济科学》1999年第2期,2000年10月略有删节

摘要
拍卖研究在现代经济学中极富理论价值与前沿意义,而从制度与行为的角度看,其在现实经济特别是金融资产市场中又颇具现实背景与广泛应用价值。本文系统阐述了各种拍卖制度的特点,从博弈论角度揭示了有关拍卖理论的私人价值模型与共同价值模型,特别分析与介绍了从实验研究领域对相关理论所作出的重要验证或修正。此外,还结合金融资产市场特别是证券市场交易制度方面的实验模拟工作,对拍卖或交易规则与市场均衡及效率实现间的关联性进行了思考,以及对新型拍卖制度的设计问题进行了考察。

拍卖(auction),从狭义上来看,是有一定适用范围及特殊规则的市场交易类型;而从广义上理解,它反映的是市场经济价格均衡机制及资源配置的内在过程和本质机理。在新古典经济学中,这方面的研究是十分薄弱的,与之相关的仅有瓦尔拉斯(Walras)“卖者喊价”(tâtonnement)或埃奇沃斯(Edgeworth)“重订契约”(recontracting)的抽象理论描绘。而在现代经济学中,拍卖理论及其发展则十分重要和引人瞩目──有关拍卖制度与行为的研究,广泛涉及到博弈理论、信息经济学及机
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
拍卖(Auction)

一种参与方通过竞价(bid)基础之上交换物品、服务的市场机制。通过一系列控制商品买卖的规则让提供方获得最佳出价(bid)。

具体拍卖机制包括
  • 第一价格(First price)拍卖
  • 第二价格(Second price)拍卖
以及
  • 英式(English)拍卖
  • 荷式(Dutch)拍卖
等多种不同形式。

密封投标拍卖(Sealed bid auction)


投标人(bidder)在不知道其他参与投标方出价前提下同时提交各自出价给招标方(auctioneer)的竞拍方式。通常,最高出价(或者采购竞拍(procurement auction)情形,最低出价)为胜出者。胜出者要么支付自己所出价(第一价格拍卖),要么支付次高(低)出价(第二价格拍卖)的钱。

第一价格拍卖(First price auction)

拍卖中,提交最高出价的投标人获得所拍待售物品、支付等于出价价格的
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
囚徒困境(Prisoner's Dilemma)

因警方确实并未掌握确凿证据,两个共犯囚徒被隔离审问,均被告知:
若一方保持沉默、拒不认罪,但被另一方出卖的话,则将被判处严厉的处罚;相反,
若己方供出对方罪行,而对方保持沉默的话,则免予处罚;当然,
若二者均供出对方的话,则都将被中等处罚;但
若二者均保持沉默到底,则都将被轻度处罚。

这两个囚徒该取何种策略呢?

按照博弈论,供出对方是单个囚徒的占优策略(Dominant Strategy):即无论对方怎样选择,这一选择都能保证己方回报(payoff)好于选择其他策略。

二者均供出对方,这也是一个Nash均衡状态。但显然还有更好的结果,即最后那种情况。

占优策略(Dominant Strategy)

策略占优是指,无论对手怎样做,该策略都能为该玩家赢得较大回报。因此,一个策略占优仅当对于其他任意玩家任意可能动作,其总是好于其他策略。取决于“好于”是严格意义还是泛泛意义(即不坏于)的,占优又分为强(st
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
标签:

杂谈

今天能有什么好事情?或许也是好事情,只是现在还远未看到其未来作用与意义的那一天。
甘肃校车事故也好,大眼老弟借评《天浴》猛烈抨击深圳联防员强奸案所产生根源的强权社会也好,无不让人坐立难安。
我们该怎么办,何去何从。
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
本来还在发愁这最后一种也是最有难度的Sort模式该如何实现的好,恰好领会到实时计算其实最重要却竟然被一直忽视了的时间因素。本来只是为了理顺实时计算,没想到沿时间轴按事物本来面貌自然而然的就意外解决了这最难的一种典型计算模式。
Java语言里提供一种Priority的Queue,只要设定好进行比较的Comparator,该FIFO队列自动解决Sort问题。至少常规情况下这种解决方案已经够用了。除非今后遇到该Queue不能解决的具体问题,到时再作计较不迟。
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
2 Merge的结果肯定是需要保存的,唯一的挑战在于需要按时间窗口滚动——除旧迎新。一开始开篇讨论最简单的counting(即计数,Merge中最简单情形)时已提到过,保存整个时间窗口内的全部24份切片(假定按日、按小时切片),然后按切片为单位处理、按切片为单位滚动,这是最直接、最直观的处理方式。当时即已指出,即使同样是保存24个切片结果,如果仅仅是计数的话,可以通过保存每个时间切片过去的sum、然后只需diff最新与最旧两个切片sum即可得到当前的整个时间窗口(全部24份切片)的总计数,而无需每小时都要完整遍历当前全部24切片以得到总时间窗口内的计数。

类似的,有没有办法增量方式实现滚动更新时间窗口内merge结果,而不是每次都要遍历整个时间窗口内全部切片作merge然后还得全量更新出去呢?

有的。但需要对每一要作merge量额外保存一个时间戳(一般实时计算输出结果本身可能即需要保留时间戳字段),改为增量更新并为外部结果存储(持久化)系统增加定期自动过期机制。增量更新可能需要按不同的key分开处理。下面给出一个持久化方案类(接口)以支持这种merge模式:

(代码
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
按Map/Reduce计算框架来看,Map不是问题,没什么悬念,虽然也可能很有(绝对数量)一些有意义的计算(统计)仅用Map方式处理即已够用,但终归有限(相对比重)。这个大框架下,问题的核心和真正挑战都在Reduce部分。众所周知的典型Reduce计算模式有:

1 Join
2 Merge(Count只是其中最简单形式)
3 Sort

其难度和代价基本上也是由低至高。现在就来逐个看看如何更正确、简单处理:

1 最大难度在于可能需要保留相当一段处理窗口以备等待要Join的记录出现,如果所保存的此类记录全都(或至少大多)与所等待的彼类记录Join上了也还作罢,否则为了知道是否确实能Join上某个彼类记录而要保留大量此类记录(最终却只有其中少量确实Join上),真是不小的代价。一般代价较小的做法是选择缓存相对较少而基本都应该能与彼类Join上的此类而不是反过来,但如果两类都没有哪类数量上明显优势或并非存在一类基本都能与另一类Join上,则困境不仅仅在于选择哪一类、存储多长处理窗口以及等多久扔掉才比较合适的一些决定上,更在于怎么将join不上的、但需要output的尽早放出去,否则
阅读  ┆ 评论  ┆ 转载 ┆ 收藏 
  

新浪BLOG意见反馈留言板 电话:4000520066 提示音后按1键(按当地市话标准计费) 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

新浪公司 版权所有