为时两周的结对编程终于告一段落,接下来将迎来对我们非常重要的团队项目。经过了几周的方案讨论,我们一致选择学术家族树作为我们的团队项目,可是,为什么选择它呢?五个人,十周的时间,大量的人力物力投入,究竟是怎样的一项工程值得我们投入如此之多的精力,如此之大的关注呢。好,下面我们将用专业的NABC分析的方法来告诉你学术家族树的意义!

 (1)Need(N)

      Need 即为需求,有需求才有追求的意义,在我看来,学术搜索家族树的需求是巨大的。首先还是说说我们的同龄人吧,近年来,越来越多的学生选择海外留学实现自己的梦想,据美国2010开放门户报告,在2009-2010学年中,美国学院和大学的国际学生总数增加了3%至690923人,这代表了一个创纪录的在美国际学生人数。而在美国高等教育机构中,中国学生人数从98235激增至127628,比上年增加29.9%。目前,中国现在已在领先来源国中位居第一。而作为多年来一直在自己的小庙里那一亩三寸地盘上,从未走出国门真正了解海外高校的人来说,对选校参照资料的选取的需求是巨大的。诚然,学界泰斗和大师级人物对于准留学生来说是耳熟能详的,但是又有多少个幸运儿能投身到他们的门下呢!很多时候,一些很不幸的GRE,TOEFL或是GPA成绩并不很高的学生往往与顶级学校顶级导师的距离是巨大的,对他们而言,选校就要更有策略性!如果投身不了名师,可以投身名师的高徒,如果做不了泰斗的弟子,不如做泰斗的徒孙。或者说另辟蹊径,找个谁也不靠的潜力股!如此这般,了解导师的来历和出身和弟子就很重要了!一个清晰明了的师徒家族树就可以轻松地将这些信息展现出来!2010年中国留学生的数目是28万,随着中国的发展,相信未来几年这个人数也只会是有增无减,即使仅有一半的学生使用学术家族树的搜索,该数目也是十分可观的!

 (2)Approach(A)

       Approach即为做法,怎样更好的展现学术家族树呢?我们将数据来源大体定为已发表论文和个人网站。关于通过论文获取,大家可以看看这篇文章(http://www.cnblogs.com/rosting/archive/2011/08/11/2135316.html)。而对于个人主页,我们可以通过网页分析“爬取”获得与人物间学术关系相关的基本信息(师傅徒弟还是师出同门,等等),并按照合理的形式存入数据库以备后用。当用户在学术搜索中搜索人物时,可以选择family选项,UI界面会展现与之相关的学术家族树,此时,他(她)的“学术亲属”和他们之间的关系将会呈现在面前,同时,还可以轻松地点击并查看其“学术亲属”的相关信息。同时还可以设定自由编辑环节,用户可以自己编辑一定的人物关系,但因为不确定其准确度,该信息与网上获得的信息是隔离的,用户添加的信息会存储在备用的数据库中,经过检验后方可录入原始数据库。我们在设计UI时将会适当考虑添加3D和动画,将家族树的信息更生动而清晰地展现出来。

 (3)Benefit(B)

      Benefit 即为好处,学术家族树有啥好处呢?有了家族树,有关某个领域,某个学校,甚至是某个学术流派的信息将不再是四分五裂的,而是紧密地联系到了一起,而这点,是很有价值的。沿着学术家族树的脉络从根到叶,参照家族树中作者发表的文章,我们不但能看出每个个体之间的关系,也可以通过这种方式,看出某个领域发展的历程,可以起到survey的作用。个领域,各流派的异同可以形象地展现出来。对于要在短时间内了解诸多学校,研究机构和原本一无所知的科学家的人来说,学术家族树就更有意义了,这种“一提一大串”的结构可以大大提高广泛了解某一个domain 并提取最有特点的信息的效率。

 (4)Competitor(C)

       Competitor即为竞争。学术家族树目前有竞争吗?有需求就会有市场,有市场就会有竞争,竞争的大小是由对手与自己共同决定的。现在市面上的流行的学术家族树主要有ArnetMiner,Mathematics Genealogy Project等, 还有像Computer Engineering Academic Genealogy, AI Genealogy Project这样的实验品,这些已有的家族树,在我看来,存在着不少的问题,一是数据库大小及数据索引速度,这是因为他们可能并没有像微软学术搜索这样庞大的数据库做支撑,而且可能没有写出非常快速的索引算法,以及由于资金限制而导致的服务器的处理速度太慢等等问题,都造成了市面上已有的学术家族树并没有带给大家非常好的体验。二是界面设计,好的界面能带给用户最愉悦的使用感受,而在已有的家族树里,我并没有找到这样一种感觉。相比他们,我们将有更强大的数据支持,更友好的用户体验,更简洁的操作和更华丽的界面!而且,由于有如此强大的数据支持,以及微软深厚的技术底蕴,我们相信能够获取到更加完善的关系网络,让每一个使用我们产品的人都会对我们所提供的结果产生信任。

      分析了这么多,无非是令我们自己更加明白产品的意义。没有一件工程是可以只靠嘴巴说就可以解决问题的。还犹豫什么呢?大干一场吧!

作者: Rosting 发表于 2011-08-26 22:13 原文链接

推荐.NET配套的通用数据层ORM框架:CYQ.Data 通用数据层框架
新浪微博粉丝精灵,刷粉丝、刷评论、刷转发、企业商家微博营销必备工具"