写程序分析了一下几部美剧在GRE词汇中的命中率

标签:
佛学 |
http://www.changweibo.com/ueditor/php/upload/20141204/14176547402732.jpg写程序分析了一下几部美剧在GRE词汇中的命中率
没想到这篇帖子会那么受欢迎,我特意去查了源文件。
你们知道一年的《经济学人》合订本的命中率是多少么?6617
!如果你没时间,一年只看10期,命中率是多少?5059(有一定误差,与样本选择有关)。
@kyxkcoach未被经济学人覆盖的gre词汇大都比较生僻,比如“油地毡”(这个词在中文里什么意思我都不懂
),“伪经”(啥玩意?);很多词用牛津一查,要么查不到,要么标识为“旧词”。
《纽约客》也差不多一样的频率,经济学人偏政经、纽约客偏文艺。自己喜欢题材就看哪类的。
原作者:水木社区@kyxkcoach
———————————————————————————————————
目的:
找出哪些美剧中含有较多的GRE词汇,然后看这些美剧,帮助记忆GRE词汇
———————————————————————————————
所选美剧: (有人说它们含GRE词汇较多)
1. Boston Legal
2. Friends
3. House
4. Desperate Housewives
5. TBBT
6. Downton Abbey (一至三季)
7. 24
———————————————————————————————
GRE词汇版本:
红宝书2007版,去掉预测词汇和数学词组后共7634个单词
———————————————————————————————
统计方法:
基于solr和lucene进行全文搜索,然后统计出词频。已经考虑到了词性变化导致的遗
漏问题,但对不规则的变化可能照顾不到(如go => went).
———————————————————————————————
统计结果:
1. 按命中率高低对美剧进行排名:
a. House 命中4262个单词
b. Boston Legal 3477
c. TBBT 3106
d. Desperate Housewives 2895
e. 24 2780
f. Friends 2763
g. Townton Abby 1294
2. 即使你把这7部美剧都看了,去重后,也只能遇到5747个GRE单词
3. 如果你再看一部纪录片(英国史)、一本中文小说英译本(三国演义),则命中数
可达 6249 个
4. 性价比最高的方案:
a.只看2部美剧: House + Boston Legal, 共4947个
b.看2部美剧 House + Boston Legal,
再看英文版三国演义,可遇到5612个
c. 比较闲的人:
House + Boston Legal + 三国 + TBBT + 英国史 =
6016个单词
———————————————————————————————
最终结论:
比较遗憾的是,没法看两三部美剧就实现覆盖所有GRE词汇的目标。这可能是我使用的候选美剧还不够典型、选择面不够广。
来源网络:薛定谔的喵
http://www.changweibo.com/ueditor/php/upload/20141204/14176545752156.jpg
http://www.douban.com/group/topic/47195832/