zdg收录,使用标签:DataMining,时间:2007-11-28 17:34:23 | 相关网摘,我也收藏
数据挖掘是一项基于严谨的统计学理论,在对企业内核数据、商业结构有充分了解和运用的基础上,对数据进行清理、去杂音、分析判定、知识提取的过程,在整个过程中均可称之为数据挖掘,使用何种技术、什么数据、或是哪种工具并不是重点。
http://blog.sina.com.cn/s/blog_4d9b3c0a01000cjl.html
zdg收录,使用标签:DataMining, filter, Apriori, Arithmetic,时间:2007-11-14 18:53:01 | 相关网摘,我也收藏
虽然Apriori算法自身已经进行了一定的优化,但是在实际的应用中,还是存在不令人满意的地方,于是人们相继提出了一些优化的方法。
http://renxijun.blog.sohu.com/59900444.html
zdg收录,使用标签:Recommend, DataMining,时间:2007-10-24 13:25:01 | 相关网摘,我也收藏
言归正传,那么针对CSDN网摘记录怎么来定义用户间的相似性?作者在这一章里讨论了欧几里德距离和Pearson相似性公式,其他的公式可以参考《数据挖掘导论》一书2.4节中的讨论(CSDN免费提供了几个章节)。在这个练习中,我将采用Tanimoto系数来定义相似性
http://blog.joycode.com/saucer/archive/2007/10/24/109623.aspx
zdg收录,使用标签:DataMining, Arithmetic,时间:2007-10-24 13:23:32 | 相关网摘,我也收藏
相似性和相异性是重要的概念,因为它们被许多数据挖掘技术所使用,如聚类、最近邻分类和异常检测等。在许多情况下,一旦计算出相似性或相异性,原始数据就不再需要了。这种方法可以看作将数据变换到相似性(相异性)空间,然后进行分析。
http://book.csdn.net/bookfiles/327/10032713191.shtml
zdg收录,使用标签:DataMining, Arithmetic,时间:2007-9-19 18:52:36 | 相关网摘,我也收藏
A toolbox combining several intelligent data analysis programs under a uniform graphical user interface.
http://www.borgelt.net/software.html
zdg收录,使用标签:Arithmetic, DataMining, Recommend,时间:2007-7-25 23:00:48 | 相关网摘,我也收藏
Apriori Algorithm 是关联规则领域里最具影响力的基础算法。它是由 Rakesh Agrawal 在 1994 年提出的,详细的介绍在这里《Fast Algorithms for Mining Association Rules》。Apriori 是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁 的;非频繁项集的任一超集一定是非频繁的。
http://my.donews.com/clickstone/2007/07/11/post-070711-224939-211/