[笔记]豆瓣校园宣讲会
开发:python=很算法,为了性能一些挖掘算法用C实现,分布式:Web服务,缓存memcache,DB=mysql,存储。容器=lighttpd。搜索引擎=xapian。应用框架=quixote。
后台:大量脚本,monitor和spider。
海量数据:十万电影,百万书,千万RSS,亿URL。
实验场:数据挖掘应用于社会化过滤器,协同过滤,聚类,关联规则,机器学习,文本挖掘,教科书上见得到的都有实验,此外最强的一点是利用社会网络进行挖掘,效果显著。
数据挖掘效果评估:不用学术界常用的指标hit rate而是用户反馈。
http://www.pkblogs.com/todwang/2007/12/blog-post.html#noanchor
他们设置了哪些标签:
Architecture douban
谁收藏了这个网址:
使用标签:douban, Architecture,时间:2007-12-5 16:34:48 | 相关网摘
开发:python=很算法,为了性能一些挖掘算法用C实现,分布式:Web服务,缓存memcache,DB=mysql,存储。容器=lighttpd。搜索引擎=xapian。应用框架=quixote。
后台:大量脚本,monitor和spider。
海量数据:十万电影,百万书,千万RSS,亿URL。
实验场:数据挖掘应用于社会化过滤器,协同过滤,聚类,关联规则,机器学习,文本挖掘,教科书上见得到的都有实验,此外最强的一点是利用社会网络进行挖掘,效果显著。
数据挖掘效果评估:不用学术界常用的指标hit rate而是用户反馈。