注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

没有想法

乱写乱画

 
 
 

日志

 
 

中国网络信息博物馆  

2007-01-06 22:29:11|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

由于好奇心比较强,找东西总喜欢沿着一条线索跑开去,然后就忘记自己本来的目的了。这不,本来是要找信息挖掘论文的,然后兴致勃勃地研究了一下北大天网的infomall系统,做Web存储的。该系统号称目前已经维护有10亿以中文为主的网页,并以平均每月一千万网页的速度扩大规模。结果试了一下,连“不许联想”这样的著名博客都没有收录,于是想问问这个系统的开发者是怎么回事。找联系方式的时候结果发现的这个博客:http://blog.people.com.cn/blog/log/showlog.jspe?log_id=1164873179824347&site_id=4797&static=1

作者是一个博士,讲述了这个系统的开发维护过程。挺现实的一篇文章。我想很多实验室里的东西也在经历着同样的命运。铁打的系统流水的研究生,人来了又走了,很多系统最后可能就不了了之了,留下的也许就是几篇论文而已。作者后来说:别人说, InfoMall 没什么好,没什么用,没什么意义。也许听起来很奇怪,但事实上就是这样的,每每听到这样的话,我都很开心。

真的是这样吗?也许只是自嘲吧。

至少我觉得这个系统还是挺有用的,数据是可以免费拿到的,有兴趣的朋友可以去联系。

  评论这张
 
阅读(180)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017