首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 数据库 第二书店 程序员

zdg/ 


共6个网摘 [ 1 ]   |  访问zdg的个人空间

成功进行数据挖掘的关键因素是什么?

zdg收录,使用标签:DataMining,时间:2007-11-28 17:34:23 | 相关网摘我也收藏

数据挖掘是一项基于严谨的统计学理论,在对企业内核数据、商业结构有充分了解和运用的基础上,对数据进行清理、去杂音、分析判定、知识提取的过程,在整个过程中均可称之为数据挖掘,使用何种技术、什么数据、或是哪种工具并不是重点。


关于数据挖掘(协同过滤、关联推荐、聚类分类)一些资料

zdg收录,使用标签:DataMining, filter, Apriori, Arithmetic,时间:2007-11-14 18:53:01 | 相关网摘我也收藏

虽然Apriori算法自身已经进行了一定的优化,但是在实际的应用中,还是存在不令人满意的地方,于是人们相继提出了一些优化的方法。


一个简单的推荐机制

zdg收录,使用标签:Recommend, DataMining,时间:2007-10-24 13:25:01 | 相关网摘我也收藏

言归正传,那么针对CSDN网摘记录怎么来定义用户间的相似性?作者在这一章里讨论了欧几里德距离和Pearson相似性公式,其他的公式可以参考《数据挖掘导论》一书2.4节中的讨论(CSDN免费提供了几个章节)。在这个练习中,我将采用Tanimoto系数来定义相似性


相似性和相异性的度量 - 《数据挖掘导论》

zdg收录,使用标签:DataMining, Arithmetic,时间:2007-10-24 13:23:32 | 相关网摘我也收藏

相似性和相异性是重要的概念,因为它们被许多数据挖掘技术所使用,如聚类、最近邻分类和异常检测等。在许多情况下,一旦计算出相似性或相异性,原始数据就不再需要了。这种方法可以看作将数据变换到相似性(相异性)空间,然后进行分析。


intelligent data analysis programs

zdg收录,使用标签:DataMining, Arithmetic,时间:2007-9-19 18:52:36 | 相关网摘我也收藏

A toolbox combining several intelligent data analysis programs under a uniform graphical user interface.


推荐系统:关联规则(2)--Apriori Algorithm

zdg收录,使用标签:Arithmetic, DataMining, Recommend,时间:2007-7-25 23:00:48 | 相关网摘我也收藏

Apriori Algorithm 是关联规则领域里最具影响力的基础算法。它是由 Rakesh Agrawal 在 1994 年提出的,详细的介绍在这里《Fast Algorithms for Mining Association Rules》。

Apriori 是一种广度优先算法,通过多次扫描数据库来获取支持度大于最小支持度的频繁项集。它的理论基础是频繁项集的两个单调性原则:频繁项集的任一子集一定是频繁 的;非频繁项集的任一超集一定是非频繁的。



共6个网摘 [ 1 ] 

zdg/相关标签



网站简介广告服务网站地图帮助联系方式诚聘英才English 问题报告
北京创新乐知广告有限公司 版权所有 京 ICP 证 070598 号
Copyright © 2000-2008, CSDN.NET, All Rights Reserved