Tag/
共42个网摘 [
1 2 ]
上一页 | |
AppZ收录,使用标签:collect, google, learn, funny,时间:2008-1-11 9:17:26 | 相关网摘,我也收藏
Google Hacks :: Online Demo
VideoMusiceBooksLyrics ApplicationsFontsTorrents
http://www.sauronz.com/manuales/
http://www.gameconventions.org/RubyAjaxPhp/
http://railsmx.com/ebooks/Rails/
http://clau.sparetimegroup.net/share/
http://sd-6643.dedibox.fr/pdf/
http://fatcat.ftj.agh.edu.pl/~orzech/
http://www.fet2005.cs.buap.mx/EBOOKS/IA/MANUAL-LISP/
http://debian.yaako.org/ebook/
http://ac.cs.nstu.ru/docs/Java/
http://www.ilsant.com/files/?C=S;O=A
Top 10 results.
This is just an online demo. Download source code.
http://googlehacks.rochakchauhan.com/index.php
AppZ收录,使用标签:learn, collect, funny,时间:2008-1-10 13:11:00 | 相关网摘,我也收藏
程序设计»
CSDN 微软Visual Studio VS官方站点 Java Technology[英] DevX[英] Mysql官方站点 源码之家 动网官方论坛 MSDN中文网站 动态网站制作指南 编程爱好者 太平洋开发教室 天极-开发者网络 CSDN-下载频道 联合开发网 赛迪网-技术应用 Dotnet俱乐部 嵌入开发网 编程中国 程序员联合开发网 问专家 Discuz 动网社区论坛 程序员家园 动网下载 嵌入开发网 IT探索者 计世网方案中心 DevX[英] 答疑网 中国.NET技术联盟 软件编程资讯网 软件工程研究中心 中国开发网 程序员基地 编程沙龙 Javaeye 中国Java开发网 程序家园 编程无限 PowerBuilderJobs[英] 程序员基地 开发者俱乐部 Visual C++ Home[英] Yahoo! Developer Chinajavaworld Visual C++开发指南 驱动开发 GameRes游戏开发 J2ME开发网 UML软件工程组织 VC知识库 Matrix与Java 大富翁编程网站 CodeGuru[英] Danga 中国WEB开发者网络
http://www.csdn.com
AppZ收录,使用标签:crack, learn, funny,时间:2008-1-8 9:00:49 | 相关网摘,我也收藏
初级班:ed2k://|file|%E5%A4%A9%E8%8D%89%E5%88%9D%E7%BA%A7%E7%8F%AD%E6%95%99%E7%A8%8B.rar|866457481|036CF8AAB3828C8872030E208922A4EF|h=XNPFXYFAFEAKB52IZCENIWQKFB6EMSIW|/
中级班:ed2k://|file|%E4%B8%AD%E7%BA%A7%E6%95%99%E7%A8%8B%E4%B8%AD%E7%BA%A7%E8%A7%A3%E5%8E%8B%E5%AF%86%E7%A0%8119830506444520y08132006.rar|950415548|CA8AE4C7FCA385C9FBF4801E84EC67EC|h=UPHATSGPLTERVNCJ44KM5ZZDHRLOPDCR|/
高级班:ed2k://|file|%E9%AB%98%E7%BA%A7%E7%8F%AD%E6%95%99%E7%A8%8B.rar|1109381404|A2048F6AB602311639FF6E65B0483AD9|h=BDNG77EQQXZ6WMUVWBUKUTMYXXFXTV6C|/
初级班密码:aiforever3800hk20060813
中级班密码:19830506444520y08132006
高级班密码:wynney0GameOver19830929
http://www.ccg.org.cn/bbs/viewthread.php?tid=426
AppZ收录,使用标签:funny,时间:2007-12-5 11:56:07 | 相关网摘,我也收藏
谷歌知音开始创建于2006-2月底,最早建立与Google的Pages服务上面,英文名称: Google Index 是Google索引的意思,顾名思义,提供Google尽可能最全的,最新的Google服务/搜索以及其他相关的网页链接。经过好多天的忙碌,全新的谷歌知音终于在这里推出了!
有了谷歌知音你不怕找不到谷歌某项服务的家门,也不怕不会用谷歌了。是你日常使用谷歌的最佳帮手,也是你了解谷歌,使用谷歌的捷径。在这里你就能成为谷歌的知音!同时 你可以任意转载这里的图片和内容,但需要提供相关连接。或者你可以直接引入连接到谷歌知音!
http://guge.jooit.com/
AppZ收录,使用标签:funny,时间:2007-12-5 11:48:44 | 相关网摘,我也收藏
绍几款手机上免费的Gtalk软件
写于2007-10-17 – 10:56 下午 | by Jason Ng | 类别 » 推介 |
Google前天发布了新的Gmail移动版,但一直没有发布过Gtalk的移动版软件。然而,由于Gtalk并不像某些IM那样吝惜不让第三方程序进行登录,互联网上就流传了多个可以登录Gtalk的第三方程序了。
本文介绍较为流行的4个免费的移动Gtalk软件。可能吧使用的测试手机是Nokia N72.
1、Reporo
事实上,Reporo不但支持登录Gtalk,还支持登录MSN,Yahoo,Aol等IM帐户,能发送文字和表情,另外,软件本身还提供自身服务器提供的聊天室(英文)。
官方的Reporo下载是需要先到官方网站选择机型,然后它会发送下载地址到你手机,但可能吧试用时接收到的都是乱码的短信。所以你可以在这个页面选择合适的版本下载。
有个缺陷是使用Reporo聊天,第一个聊天对话会带有“尾巴”。第一个信息的后面会被放上Reporo的广告。
数据传送方式:CMWAP.
2、MGtalk
MGtalk支持的手机型号不多,至少我的N72无法使用,我用朋友的Motorola L7测试可以使用,其官方网站返回了404错误,但互联网上流传着MGtalk的汉化版,在这里可以下载。
MGtalk不但支持Gtalk,同时还可以查收Gmail。不过现在似乎没有这个需要了。
数据传送方式:CMNET
http://www.kenengba.com/post/265.html
AppZ收录,使用标签:funny, learn,时间:2007-10-24 13:42:18 | 相关网摘,我也收藏
一个简单的推荐机制
最近,O'Reilly出版了Toby Segaran著的《Programming Collective Intelligence》(据说该书将由博文视点翻译出版),讨论如何从数据(譬如用户生成的数据)里挖掘信息的各种算法和技术,非常实用,对正在建造Web 2.0网站的开发人员尤其有用。跟大多数数据挖掘和机器学习的书不一样,书里包含了大量Python代码,使用网上现有的数据集或可以轻易采集的数据(譬如blog)或公开的API(譬如Digg,eBay的),助你理解各种算法,解释如何从大量的数据中获取关于用户体验,营销性,个人口味,和人类行为的认识。该书得到了首创“Web 2.0”一词的O'Reilly公司CEO Tim O'Reilly的大力推荐。
其中的第二章《Making Recommendations》讨论了协作性过滤技术(Collaborative Filtering),通过搜寻一个很大的群体,从中找出与你口味相似的人,然后把这些人喜爱的其他东西,聚合起来,创建一个推荐的排行榜(譬如电影推荐,产品推荐等等)。书中使用了del.icio.us的数据和API,可惜他们最近更改了API,所以无法使用书中的代码做练习。但想起了CSDN的网摘功能,花了点时间把大部分的网摘记录爬了下来(感谢CSDN的曾登高提供其中几个人的数据)。我把记录都放在一个名叫Post的表里了,它包含URL(用户保存的文章的地址),Title(用户保存使用的标题),UserName(用户名),PostDate(保存网址的日期)这些字段。
得到的数据集中包括3753个用户,不同的链接数为68304,最多的一个人保存了7519个链接,平均每个人保存了23个链接。保存人数最多的是这篇贴子,
40种网站设计常用技巧
链接的来源是这样的,
网站 链接数
community.csdn.net 21770
blog.csdn.net 12260
blog.donews.com 1865
topic.csdn.net 1836
news.csdn.net 1526
www.cnblogs.com 1237
book.csdn.net 831
dev.csdn.net 810
download.csdn.net 773
spaces.msn.com 758
tech.sina.com.cn 719
www.donews.net 491
blog.sina.com.cn 438
club.book.csdn.net 378
www.infoq.com 336
前十位CSDN网站占了7个,好像不是很健康啊,。
言归正传,那么针对CSDN网摘记录怎么来定义用户间的相似性?作者在这一章里讨论了欧几里德距离和Pearson相似性公式,其他的公式可以参考《数据挖掘导论》一书2.4节中的讨论(CSDN免费提供了几个章节)。在这个练习中,我将采用Tanimoto系数来定义相似性(图片来自原书网站),
在这里Na代表用户a保存的所有链接数,Nb代表用户b保存的所有链接数,Nc则代表用户Na和Nb间共同拥有的链接数。譬如,如果我保存了10个链接,你保存了20个链接,我们共有的链接为5个,那么我们间的相似性为5/(10+20-5)=0.2。
使用Tanimoto系数的的原因是对链接这样要么有,要么无的二元性的数据感觉很直观,而且容易计算(用数据库操作即可)。
先生成一个表,
create table RelatedUser (username1 nvarchar(50), username2 nvarchar(50), urlcount1 int, urlcount2 int, commoncount int, coeff decimal(18,16))
然后填充其中的数据,针对用户做个cross product,然后更新共有的链接数以及各自的链接数,
insert into relateduser (username1, username2, commoncount)
select username1, username2, count(url)
from
(
select p1.username as username1, p2.username as username2, p1.url
from post p1, post p2
where p1.url=p2.url
and p1.username <> p2.username
) t
group by username1, username2
go
update relateduser set urlcount1 = ps.urlcount
from relateduser u
inner join (select count(*) urlcount, username from post group by username) ps
on u.username1 = ps.username
go
update relateduser set urlcount2 = ps.urlcount
from relateduser u
inner join (select count(*) urlcount, username from post group by username) ps
on u.username2 = ps.username
go
生成Tanimoto系数,
update relateduser set coeff = convert(decimal,commoncount)/(urlcount1+urlcount2-commoncount)
go
让我们来看一下与用户jiangtao相似的用户,
select username2, commoncount, coeff from relateduser where username1 = 'jiangtao' order by coeff desc
go
其中前十个为
用户名 共有的链接数 Tanimoto系数
zdg 78 0.017165493
94smart 80 0.009725261
rjchen 14 0.009504413
hcat1999 4 0.004561003
waynehuge 4 0.003910068
grhunter 4 0.003710575
tq85 10 0.002983294
tonywjd 3 0.002811621
flyfish10000 2 0.002538071
bluebubble 2 0.002427184
假如我们指定只有共有的链接数超过10个才算相似,那么很明显,与jiangtao口味相同的用户依次为(难怪啊,恐怕生活中他们就是jiangtao的朋友),
zdg
94smart
rjchen
tq85
据此,我们可以向jiangtao推荐他还没有读过的文章,
select title,url from post where username in (
select top 10 username2 from relateduser
where username1 = 'jiangtao' and commoncount >=10
) and url not in (
select url from post where username = 'jiangtao')
order by postdate desc, title, url
其中前十篇为
“正略一品”系列之六:在美国研究草原上的狗尾巴??赵民 - 新浪BLOG
The Podium ''08 - Election Guide 2008 - MSN
卓越亚马逊:WIKINOMICS维基经济:Management:Business & Investing 经管与理财:进口原版:图书:Don Tapscott
理念随笔之八:换位思考,假如咱是庄家
微软的.NET源代码:可远观而不可亵玩也
TechMeme:聚合的力量
传统媒体和新媒体的对决:Techmeme Leaderboard上线
Facebook开放平台完全解析
Google为何收购Jaiku而非Twitter?
Google首页的CSS Sprite
这是基于用户的过滤,还可以做基于item(这里是URL)的过滤。可惜,因为URL数太多,在数据库里对URL做cross product需要非常大的内存/硬盘,可惜这个机器上的容量很小,所以只好放弃。
http://blog.joycode.com/saucer/archive/2007/10/24/109623.aspx
共42个网摘 [
1 2 ]
上一页 |