houlin476/
共47个网摘 [
1 2 ]
下一页 |
访问houlin476的个人空间
houlin476收录,使用标签:算法, 迅雷, 下载,时间:2007-8-14 8:49:21 | 相关网摘,我也收藏
下载部分内容计划摘要,听起来真不错,又是一个中庸的想法,我现在越来越喜欢中庸了,没错,就是它,但下载哪部分内容呢?我们可以根据文件大小利用一些简单的散列算法生成散列值,根据这些值在文件的不同部分读取一定量的数据,总数据量控制在K级别(同网页差不多大小),然后将这些数据拼装成整体存储并生成其摘要。这种方法是可行的。首先,它的下载量不大,其次,根据该方法判文件的等价性同基准方法(根据所有数据算摘要)比准确率几乎相同(证明过程我就不说了,实践才是最好的标谁)
利用摘要判断文件等价性的方法有一个好处是可以忽略一些次要信息,比如文件名,创建时间,修改时间等,但文件类型,长度和摘要则是需要考虑的成份。也就是说,如果这三者一样,则我们认为文件是一样的。
http://blog.csdn.net/mudboy/archive/2006/10/10/1328537.aspx
共47个网摘 [
1 2 ]
下一页