jiangtao/
共5个网摘 [
1 ] |
访问jiangtao的个人空间
jiangtao收录,使用标签:架构, Digg,时间:2008-8-27 9:42:52 | 相关网摘,我也收藏
Digg 工程师采用 LAMP (Linux, Apache, MySQL and PHP) 模式。这个 Alexa 排名在 100 左右的、自我估价 1.5 亿美金的站点目前有超过 100 台的 PC 服务器(足够少了),可以粗略分成三个部分:数据库服务器,Web 服务器,搜索服务器。
数据库方面,和其他成功的 Web 2.0 站点一样,也是 MySQL,不过 Digg 稍微"激进"一点,用 MySQL 5,而且号称从 MySQL 4 升级到 5 性能没有什么影响。 OLTP 应用用 InnoDB 引擎, OLAP 用 MyISAM。后端数据库的读比例达到 98%,写只有 2%,实际的读写比例应该高于这个数字,这应该是 Digg 在前端用 Memcached 以及 APC PHP accelerator / MCache 做缓存后的效果。在 IO 上似乎压力并不大。
数据库分割用 Sharding (分片)的机制。从透露出来的信息看,Digg 数据量并不大,仅仅刚超 30g . 看起来是只存储了一些元数据。至于这个 Sharding 或者 Shard, 其出发点有些类似于数据库的分区,差别可能就是不再一个库上吧,其实都是结合业务和应用来对一些数据对象进行分割。
http://www.diybl.com/course/1_web/webjs/2008224/101539.html
jiangtao收录,使用标签:digg, 算法,时间:2007-12-3 13:18:18 | 相关网摘,我也收藏
是什么力量把一篇文章带到首页上的?算法啊算法~
* Digg的算法用来解释用户和粉丝们的近期参与等级。
* 频繁的成功(指上首页)会导致随后的上首页几率大减。应该走三天打鱼两天晒网路线。
* 从“高价值”用户那儿搞到快速有效的Diggs。
* 一篇文章显示到首页上需要的Diggs和以下两点相关:在某特定时间段内获得的Digg数,以及这个数值和平均值的对比。
* 在科技,世界和商业类别中的竞争比运动和娱乐类别更激烈。如果某个故事是它所在类别中的热门,50个Digg就可将它顶到首页上去。
* 一个故事获得投票的速度越快,晋级所必需的投票数就越少。但是多样性很重要。由"voting rings"digg的故事会在队列的高位保持数小时。
* 过多被埋(囧)会导致你的故事被从队列中移除。
* 评论会让一个故事脱颖而出。当然,不能是无效评论...
* 错误的:需要一个确切数量的投票数才能上首页。
* 错误的:如果你的故事没有被一个顶级用户提交,那么你注定上不了首页。
* 错误的:朋友数量很重要。Digg真正需要的是一个文章收到Diggs的多样性。
* 错误的:那儿有个迈向成功的24小时窗口
http://jandan.net/2007/12/01/how-diggs-algorithm-works.html
jiangtao收录,使用标签:IT科技, digg, blog,时间:2005-12-12 22:27:28 | 相关网摘,我也收藏
Digg is a technology news website that combines social bookmarking, blogging, RSS, and non-hierarchical editorial control. With digg, users submit stories for review, but rather than allow an editor to decide which stories go on the homepage, the users do.
http://www.digg.com/faq
共5个网摘 [
1 ]