首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 数据库 第二书店 程序员

zdg/ 


共4369个网摘 [ 1  2  3  4  5  6  7  8  9  10 ... 146 ]  上一页 | 下一页  |  访问zdg的个人空间

利用電腦探討中國古代益智遊戲─「華容道」之解法

zdg收录,使用标签:算法,时间:2008-6-16 17:22:04 | 相关网摘我也收藏

在本文中,我們嘗試設計演算法,利用電腦找出中國古代流傳下來的益智遊戲─「華容道」的最少步數,以驗證前人資料上所記載各盤面的最少步數是否正確。此遊戲中許多盤面之解答的移動步數超過100步,因此不能直接用暴力法搜尋,目前文獻上尚未見到電腦之解法,只有一些人為的解答有記錄,也有一些程式將這些人為的、不是最佳的解答直接記錄下來作展示。因此我們構思如何解決此困難之問題。在此論文中,我們發展了一些技術,目標是求出完全的最佳解,並實際撰寫程式測試,要求在可忍受的時間內解出。程式的執行結果與先前得到的前人資料有所出入,有些與資料記載的吻合,有的則較記錄為多,還有一些比資料上的少上三至五步之多。驗證了一下程式輸出到檔案的最佳解,發現程式所求得比資料記載還要少的結果應是正確的。至於程式求得較前人資料為多的部份,可能是前人的文獻資料有誤,因為資料上只記載著各盤面最少步數的解題記錄,並無參考的解法。


商神一败

zdg收录,使用标签:人物, 胡雪岩,时间:2008-6-16 16:47:49 | 相关网摘我也收藏

在一开始,胡氏战略似乎奏效。西方学者斯坦利在《晚清财政》一书中记录,1882年9月,上海一级生丝价格已高涨至17先令4便士,而在伦敦交易所的价格仅为16先令3便士。国内价格反超国际期货价。到1883年8月,大商战进入决战时刻,胡雪岩前后已投入资金超过1500万两,继续坚壁清野,囤货坚挺,大部分上海丝商停止营业,屏气而作壁上观。华洋双方都已到忍耐极限,眼见胜负当判,谁知“天象”忽然大变。

变数之一,欧洲意大利生丝突告丰收,欧洲期货市场的紧张顿时暂缓,消息传回中国,军心开始动摇。

更大的变数是,中法因越南问题交恶,爆发战争。1883年10月,法国军舰驶抵上海吴淞口,扬言进攻江南制造局,局势紧张,市民提款迁避,市面骤变,金融危机突然爆发。外国银行和山西票号纷纷收回短期贷款,个人储户也紧急提现。钱庄逼账“急如星火,沪上商局大震,凡往来庄款者皆岌岌可危;虽有物可抵,有本可偿,而提现不能。钱庄之逼,一如倒账”。一般商品无不跌价30%至50%,所有房地产都难脱手,贸易全面停顿。

世事如此,胡雪岩已无力回天。11月,江浙丝商的价格同盟瓦解,生丝易烂,不能久储,胡雪岩不得不开始抛售,价格一路狂泄,损失以千万两计。生丝对搏失利,很快影响到“坚如磐石”的钱庄生意,民众排队提款,一些与胡雪岩不和的官员趁机逼催官饷,可怕的挤兑风潮出现了,先是杭州总舵关门,继而波及北京、福州、镇江以及湖北、湖南等地的20多个字号,到12月5日,阜康钱庄宣告破产。


iPhone新手必看,iPhone火星人必看,全看过了再来问我

zdg收录,使用标签:iphone,时间:2008-6-5 1:16:15 | 相关网摘我也收藏

小技巧提示:有机友在删掉Summerboard软件之后重启会出现白苹果,没事,这个时候你的手机还是在运行的,连接电脑再次使用PC套件或I B U S安装你删掉的Summerboard软件后(注意一定要装你删的那个版本,别的版本你就继续享受白苹果给你带来的乐趣吧),再重启就没事了,为了这个我还特地做过一次小白鼠,我使用这个方法成功了。


iPhone SDK 观察(之一)

zdg收录,使用标签:iphone, SDK,时间:2008-6-2 18:04:17 | 相关网摘我也收藏

这个搅得大家精神莫名亢奋的 SDK Roadmap 到底是虾米碗糕?我们先来简单看看吧:

1、开发环境为 Leopard 上的 Xcode 套件(其中包含定制的 Instruments 实时性能监测和 Debug 工具,以及接近全功能的 iPhone 模拟器),语言为 Objective-C,但提供 C,C++ 的原生嵌套支持。

2、iPhone OS 的系统架构和多数 Framework 与 OS X 大同小异,从 Unix 内核,到 Core Foundation Framework 系统级服务,再到更高层的Quartz2D、 Core Animation、Core Audio、OpenGL ES/AL都完全相同或者是功能相似的简版,一直到最顶层的 API 才有些真正重大的区别,桌面版 OS X 使用 Cocoa, 而 iPhone 版则是变体 Cocoa Touch。所以一个有经验的Mac程序员几乎可以毫不费力的适应 iPhone 的编程。

3、SDK 免费下载,但是想要真正在 iPhone 上运行需要花费 99 美元加入 iPhone Developer Program, 由此不仅能得到官方的技术支持,也允许其将软件挂上唯一的 iPhone 软件商店 App Store 出售,开发者自由定价,销售收入与苹果七三分成,除此之外没有任何的管理、帐目、挂载费用——如果你宣布免费,那么苹果也就不向你收钱。

4、苹果将会对上线软件进行审核,诸如色情、恶意、违反开发者协定等等的软件将不能获准出售。

5、苹果联合著名风投 KPCB 设立总额高达 1 亿美金的 iFund,用来鼎力支持在 iPhone 平台的创业的开发商。


StartUp技术交流会:博客大巴 / VeryCD / 客齐集 / 联络家 / CDNUnion

zdg收录,使用标签:memcached, SVN, CDN,时间:2008-5-31 22:44:42 | 相关网摘我也收藏

所有网站都用了Memcached,并通过避免对数据库的连接而大大提高了性能(命中率一般在90%以上);

关于:多memcached的分布策略;
客齐集
规模: 在多台前端应用服务器上划出一定空间,
分布规则:使用的是memcached addserver方式由memcache自己进行缓存分布;
单点失败处理:遇到个别节点中断会retry;
博客大巴和VeryCD应用类似:
规模: 几十G(单个2G);
分布规则:都是自己应用设置设置缓存分布规则,对数据进行分布,
单点失败处理:如果遇到Memcached中断并不尝试其他服务器;

关于memcache的压缩:
PHP客户端可以设置压缩外, server端也有更详细的压缩配置选项(memcached的文档中有?);
关于memcached的扩展性: 最新版本有考虑consistent hash(在扩展服务节点后,旧内容仍然再旧服务器上,不用按重新按新的分布规则生成新缓存)
memcached: bin模式存储;

对于缓存对象:大的List列表页对象用memcache缓存对效率提升很重要;


让我们一同重温下iPhone手机的辉煌发展史吧!

zdg收录,使用标签:iphone,时间:2008-5-28 22:27:56 | 相关网摘我也收藏

尽管从苹果iPhone去年6月底正式发售至今,乔布斯与全球黑客们的“博弈”就从来没有停止过,但通过上面的时间表不难看出,自2008年3月以来,苹果再也没有发布过正式的iPhone固件新版本,这种“博弈”也似乎陷入了停滞状态。然而根据了解,全球范围内苹果iPhone市场仍然暗涌不断——世界各地iPhone上市的消息甚嚣尘上、3G版新iPhone的犹抱琵琶半遮面,等等。


为了流量,海内开始鼓励造假

zdg收录,使用标签:hainei, SNS,时间:2008-5-28 15:18:29 | 相关网摘我也收藏

就在下午之前,我依然把海内作为一个相对严肃的sns网站,我的很多blog文章都在海内同步发布。海内的此举,我颇有点失望。

失望的倒不完全是买卖奴隶这个功能,而是在海内坚持实名,坚持真实社交那么长时间之后,会用这么一个功能来刺激生产大量的假用户。我最欣赏王兴的一点就是坚持与执着,但是很不幸的是,在开心娱乐的冲击下,海内终于倒下。


B2C杂思(3):整体性提升长尾流量的品质

zdg收录,使用标签:SEO, ECommerce, 长尾,时间:2008-5-28 15:17:28 | 相关网摘我也收藏

提升自然检索长尾流量的三个核心是增加收录、增加权重和提高搜索命中率,提高搜索命中率主要依靠网页标题(title)。

我自己的实践体会是,在词频分析基础上再结合用户行为分析,很可能会发现原来完全想不到的优质匹配要素词,否定原来肉眼观察出来的以及同类站常用的一些词。


产品设计体会(五一)——敏捷的估计与规划

zdg收录,使用标签:敏捷, 产品经理, 管理,时间:2008-5-28 15:14:30 | 相关网摘我也收藏

敏捷的里程碑是功能驱动的,先完成可交付的最“重要”功能,重要取决于功能商业价值、生命周期、实现难度等综合的结果。而传统的瀑布模型的里程碑是任务阶段驱动的,到了项目50%的时间,可能进入“编码”,但对客户来说,等于0%。而且这样的模式会陷入“实现难度决定开发顺序”的不合理模式,因为这里有个不合理的假设前提:所有功能都能够完成、必须完成,中间过程对客户是透明的。

项目估计的不确定性是会累积的,80%×80%×……,所以开始订的项目计划,在一个月后已经面目全非,强行的遵守是没有意义的,而应该不断的修正计划,当然,更好的做法是一开始的计划中间留有一些柔性的内容。

随着时间变化,必然有新的信息出现,特别是瞬息万变的互联网业界,死守着开始的项目计划不调整是没有逻辑的做法,敏捷的迭代刚好权衡了变化的成本和不变的成本,就是:不变本次迭代,更新下次迭代,这是一个将项目计划细化粒度的做法。

需求唯一不变的特征就是“不断变化”(plus不断细化),敏捷的思想就是欢迎变化,拥抱变化。瀑布模型一次性完成的需求分析,会存在“过度需求”的问题,降低整体效率。


[转]提问的智慧(富格式图文版)

zdg收录,使用标签:BBS,时间:2008-5-27 16:39:03 | 相关网摘我也收藏

更多精彩内容,欢迎访问恋花蝶的博客!一直都有收到各种方式的留言、邮件、短消息,有些问题我真的不知道怎么去回答,但又不忍就这样任由这些问题堆放在尘封的角落,辜负那份信任与期待,只好给出自己的一些不切乎问题的回复,一来一往间彼此都没有能够留下好的印象。直到看到这篇来自大师的手笔,觉得总算是找到一份很好的“提问指南”。所以我把它复制下来,重新进行了中文格式的排版,希望能够带来更好的阅读体验。感谢ZoomQ根据本文绘制的脑图,让我们有更加丰富的形式来学习。


跟波利亚学解题(rev#3)

zdg收录,使用标签:math, 思维,时间:2008-5-27 16:31:19 | 相关网摘我也收藏

这些一般性的思维方法,就是波利亚用了整整三本书,五卷本(《How To Solve It》、《数学的发现》、《数学与猜想》)来试图阐明的。波利亚的书是独特的,从小到大,我们看过的数学书几乎无一不是欧几里德式的:从定义到定理,再到推论。是属于“顺流而下”式的。这样的书完全而彻底的扭曲了数学发现的真实过程。


iPhone的七宗罪——与她邂逅的5个月

zdg收录,使用标签:iphone, 苹果,时间:2008-5-26 23:40:57 | 相关网摘我也收藏

时尚是一种品位,是传统和现代的结合,是发展和高雅的统一;生活是一种文化,是个性的张显,是本色的展现。
将时尚融入生活,就是Apple的理念……


和创业邦聊Widget和Netvibes

zdg收录,使用标签:widget,时间:2008-5-23 18:01:45 | 相关网摘我也收藏

本次对话,主要涉及以下几个话题:

Netvibes概况及Widget现状;
开放数据是Widget发展的终极方向;
widget和social network之路还很漫长;
Netvibes在中国进展顺利 个性化主页是未来方向;
Ginger将改变网民的社交方式;
Widget商业模式探索;
统一的widget标准是难以逾越的障碍;
阴差阳错进入Netvibes


王石借“纠错”暗渡陈仓

zdg收录,使用标签:finance,时间:2008-5-23 17:52:41 | 相关网摘我也收藏

所谓1亿元的重建,与“纯公益性质”及“将在未来3到5年内,根据实际需要逐年支出”的搭配,实在是进可攻、退可守的缜密计划。1亿元的投入,全部收回成本,也可说是“纯公益性质”,万科捐的还是那200万元,一分不多。而且,公益性开发可以享受税收优惠,可以抵扣所得税,这相当于给万科带来意外的收入,把先前捐的200万再挣回来也不是没有可能。况且,还有“未来3到5年内”的腾挪空间。怪不得万科不选择二次捐款!

因此,当万科作为一个有社会责任感的企业形象突然倒塌时,谁也不应该感到奇怪。对饱受苦难的灾区尚且如此精打细算,又能奢望什么?企业的社会责任感是一种自觉的流露,而不是包装出来的,哪怕再高明的危机公关大师,也难免有疏漏。这,或许是“10元捐款”事件给我们的启示。


Basic Steps:融资基本步骤

zdg收录,使用标签:VC,时间:2008-5-23 15:20:34 | 相关网摘我也收藏

VC也没兴趣看你的计划,他们第一时间想知道的,是:

“你这个企业的客户是谁,产品是什么?你的产品,比较现有的产品或服务,帮你的客户解决了什么问题,消除了什么痛苦,或增添了什么价值?你的产品的价值超过你的成本多少?市场有多大?”

如果20页的PowerPoint,2000字还说不清楚的话,自己还没想清楚,企业也不大会成功。


直复营销和品牌中的新媒体崭露

zdg收录,使用标签:市场, Web2.0, sx,时间:2008-5-21 11:06:56 | 相关网摘我也收藏

# 尽管相对较新,Web 2.0显然已被认同是一种品牌创建的渠道

* 84%的受调查者使用它来促进品牌意识
* 82%使用Web 2.0工具提高品牌偏好(brand preference)

# 新媒体被用于直复营销与用于品牌创建一样多

* 83%利用Web 2.0产生销售
* 80%用Web 2.0产生商机

# 大多数营销人员意识到了这样的机会,即新媒体创建整合直复营销和品牌

* 85%被调查者利用Web 2.0参与其用户,并认为这是用户互动(customer engagement)最有效的机制
* 84%的被调查者利用Web 2.0建立忠诚用户的社区,并发现这样做很有效(平均评分为5.0)

# 其他调查数据

* 82%的受访者为Web 2.0分配四分之一或更少的营销预算
* 70%表示精于交互营销的被调查者,也只为Web 2.0分配了大约四分之一的预算


1.1.3新手成长手册-从破解到使用-3.15更新1.1.3升级到1.1.4,汉化方法,WiFi架设

zdg收录,使用标签:iphone,时间:2008-5-12 23:55:16 | 相关网摘我也收藏

我最后想对新手说的是,尽管放心大胆的放手去试。iPhone就是台小电脑,软件弄坏了大不了重装系统而已。试过就知道,人人都能用好iPhone。


2006-2011年美国网络广告开支(按形式)

zdg收录,使用标签:网络广告,时间:2008-5-12 15:40:41 | 相关网摘我也收藏

# 微软就被划入了剩余的那16%范围,由于在线业务继续亏损(08年Q1,微软在线服务部门继续赤字,亏损额增加至2.28亿美元; 雅虎第一季度营收为18.18亿美元,净利润高达5.42亿美元,即使减去阿里巴巴IPO带来的收益,也有1.41亿美元的净利),微软的确需要Yahoo!,那Yahoo!是否需要微软?
# 就各种在线广告形式占所有网络广告的份额中,只有富媒体/视频广告未来有比例的扩大,从2006年的占7%扩大到2011年的占13%,其余广告形式在所有网络广告中的比例都是持平或下滑,包括搜索广告,也仅保持其40%的份额,并没有大幅扩大比例,而这一份额比例在2004年就已达到。


CSDN的OpenAPI的简单测试

zdg收录,使用标签:CSDN, OpenAPI, BBS,时间:2008-5-9 17:46:40 | 相关网摘我也收藏

这个接口已经出来一段时间了,下面的例子用Axis生成代理程序,然后调用其中的几个接口


[AllenKids 专稿] iPhone SDK 观察(之二)

zdg收录,使用标签:苹果, iPhone,时间:2008-5-9 17:14:16 | 相关网摘我也收藏

是什么让 Apple 的平台策略显得那么独特呢?

答案是前所未有的集成/整合,如果我们来检查下苹果在各个市场投放的产品,就会惊讶的发现,它们的架构竟然是那么的整齐划一:从 Xserve,Xsan 到 Mac Pro,iMac,MacBook,再到 iPhone,新一代的 iPod touch,Apple TV……它们最核心的技术竟然没有什么区别,都是 Apple 招牌式的未来主义设计 + 相对精良的硬件制造 + Darwin 核心(OS X 的 Kernel)+ Core XX 架构 + 各种通用 API + Cocoa 开发环境 + 业界领先的人性化 GUI (+ iTunes 网上商店)。


PCPOP卖掉?10倍PE?8000万?

zdg收录,使用标签:融资并购, IT业界,时间:2008-5-8 22:58:56 | 相关网摘我也收藏

据了解,如果是8000万,已经是分众谈判收购价格的1/2。比前几个月PCPOP跟一个IT网站谈判时候少了4000万。

此外,如李想所说,PCPOP在8年的发展过程中,他自己稀释掉出来了一半多的股份。据了解,目前李想还有泡泡网主体公司48%左右,他的高管团队加起来35%左右。

此外,IT168前日也并购了一个技术类网站,在拿到itpub之后,IT168看样子还是要在技术信息服务、信息化方面寻求突破。


MySpace无法完成收入目标 用户价值难量化

zdg收录,使用标签:MySpace,时间:2008-5-8 21:39:43 | 相关网摘我也收藏

根据新闻集团今天公布的第三季财报,尽管包括MySpace在内的福克斯互动媒体旗下网站流量保持增长,但该部门营收却从第二季的2.33亿美元降至2.1亿美元,其中约三分之一来自与谷歌签订的为期3年的广告合同的收入。

2006年8月,谷歌与新闻集团签署协议,获得向MySpace等网站独家提供搜索技术及广告的权利。作为交换,谷歌承诺至少向新闻集团支付9亿美元作为收入分成。支付时间将从2007年第一季度开始,至2010年第二季度结束。

尽管如此,MySpace依然是全美第一大社交网站,在美国的活跃用户达7300万人,而Facebook只有3600万。此外,MySpace用户的平均在线时间也比Facebook多44%。


股市长期定投的神奇定律

zdg收录,使用标签:finance,时间:2008-5-8 18:09:04 | 相关网摘我也收藏

这样的结果或许让很多人跌破眼镜,一直以来,择时都是投资者非常看重的一个因素。可是在长期投资的过程中,择时因素所发挥的作用似乎被淡化了。幸运的L先生尽管永远选在了低点,获得的投资成绩也不过是永远买高了的U先生的2倍。在螺旋式上升的证券市场上,一时的波动在短期之内对于投资者的影响可能是巨大的,但是从长期来看,短期的波幅产生的影响将被逐渐消减。


真实的困境

zdg收录,使用标签:Web2.0, SNS, 网站运营,时间:2008-5-8 17:46:00 | 相关网摘我也收藏

从WEB2.0兴起,几年来圈内人逐步形成了一个共识,即用户的真实性是推动网站成长的主要动力之一。校内网星号用户在活跃度,人均PV,朋友数量等方面平均看,1个顶没有星号的6个用户。

时至今日,我们仍然没能摆脱关于真实性的困境。如果促进真实的手段还是靠注册环节实现,如果用户们还是以同样理由拒绝真实,我们这些2。0的信徒们该如何推广网站,吸引用户呢?靠邪门歪道?靠一招鲜?靠降低真实性?如果这样,我们还是在做2。0吗?我们和几十个成功和几十万个失败的1。0网站有什么本质区别呢?


案例研究:卓越、当当是如何用搜索引擎推广

zdg收录,使用标签:SEO, Dangdang, Amazon,时间:2008-5-8 16:21:25 | 相关网摘我也收藏

在百度的投放费用上,卓越第一、亚马孙和当当相差不多。如果一定要有个定量的比例的话,卓越在百度上的关键词投入费用大约是亚马孙和当当的1.5倍左右。

卓越亚马孙更侧重于在GOOGLE上的推广,亚马孙在GOOGLE上的推广规模和在百度上的推广规模相差不多。而卓越网在GOOGLE上的推广却几乎可以忽略不记。相比较而言,当当网站在GOOGLE上的投放规模要小很多,在某种意义上是一种尝试。

只要是当当和卓越同时购买的关键词,当当必然在位置上要超过卓越。当然这是在我抽查的1000个关键词里面,其中有交叉的关键词为634个,而当当在前面的关键词为467个。可见当当面对卓越这个竞争对手,一定要压过一头的生猛性格。

这三个网站中,所投放的关键词数量规模都在几十万左右,我们可以想象,如何科学的更换、管理这几十万个词,是一个巨大的工程。

3月份期间,卓越增加了9000个关键词,去掉了1500个关键词,占全部的单关键词的57.8%,9%
亚马孙增加了14836个关键词,去掉了5000多个关键词,占全部单关键词的58.7%,20%。
当当在3月份增加了6000个关键词,去掉了5574个关键词,占当当全部关键词的44.5%

无论更改的效果好坏,至少在关键词更新的频率和勤奋程度上,卓越要超过当当10个百分点。我们可以看到这三个企业都是投入大量人力、资源来不断的尝试新的关键词,然后通过各种效果再剔除掉过时的关键词,卓越、卓越亚马孙在更新关键词的频率上要大于当当。

卓越的关键词选择大部分是针对他们自己所卖的商品,其中以书名为关键词的比较多。但对于一些竞争比较激烈的关键词,比如医药方面的图书关键词购买的价格很好的选择了排期,没有刻意排在最前面。
相比较于卓越,亚马孙除了投放大量的书籍外,还提供了大量的其他产品比如领带,皮肤护理用品,MP3等等
当当选择关键词的策略集中在书籍产品,皮肤护理产品,MP3等产品方面。但词的范围较窄,相对来说是一些热门的竞争程度比较激烈的关键词。


如何学习投资 推荐几本教材

zdg收录,使用标签:finance,时间:2008-5-6 15:16:03 | 相关网摘我也收藏

作为价值投资的初信者,最好的入门途径是,反复阅读一些价值投资的经典著作,记录自己的思考过程,同时比对自己之前的操作经验,这对于领悟价值投资的主旨,是很重要的。

在我个人的体会中,最为重要的一点是,要真正深入去研究一只股票——从自己最喜欢的公司或行业开始,学习股票的估值方法,结合自己的既往知识和经验,细心阅读并比对年报(如有增发,增发招股说明书也很重要),总结过往几年的经营历史和战略走向等等,会有很多意想不到的收获。


蒙特卡罗算法在游戏(围棋)AI中的应用

zdg收录,使用标签:AI, 围棋, MonteCarlo,时间:2008-5-5 18:45:53 | 相关网摘我也收藏

我们选择蒙特卡罗算法的原因之一是围棋中应用极小极大算法(Minimax Algorithm,一种在棋类中常用的选择“最佳”的下一步着法的算法,参考这里)来计算2步或3步之后的着法产生的计算量

蒙特卡罗算法评估某一着法有多好(差)的方法是由两个随机AI(选择的着法完全随机)对一个给定的盘面下若干盘“虚拟棋”。从一个给定的盘面开始,然后对每一可行着法计算指定数量的后续着法完全随机的“虚拟棋”。之后,我们统计所有可行走法的平均值,以反映出“好”的着法。最后是选择有着最高的平均值的着法,蒙特卡罗AI在真正的棋局中应用这一着法。这是基于假设这一高分着法通常比其它的选择产生的结局都要好来做的。


JavaScript Memoization

zdg收录,使用标签:Javascript, Cache,时间:2008-5-5 18:36:47 | 相关网摘我也收藏

Memoization 是一种将函数返回值缓存起来的方法,在 Lisp, Ruby, Perl, Python 等语言中使用非常广泛。随着 Ajax 的兴起,客户端对服务器的请求越来越密集(经典如 autocomplete),如果有一个良好的缓存机制,那么客户端 JavaScript 程序的效率的提升是显而易见的。

Memoization 原理非常简单,就是把函数的每次执行结果都放入一个散列表中,在接下来的执行中,在散列表中查找是否已经有相应执行过的值,如果有,直接返回该值,没有才真正执行函数体的求值部分。


土豆、千橡纷纷融巨资 网络2.0回春?

zdg收录,使用标签:Intelnet, 融资并购, sx,时间:2008-5-5 13:13:57 | 相关网摘我也收藏

五一过后,两件大事震动互联网江湖,一是微软宣布放弃对雅虎的收购,不知此时是雅虎开心还是Google开心,二是千橡获得4.3亿美金巨额融资,陈一舟又可以让自己的校园梦继续往大的做,至少4.3亿美金不会让校内在短时间内“非死不可”(facebook)。


蛙蛙推荐:谈谈网络爬虫设计中的问题

zdg收录,使用标签:spider, 搜索技术,时间:2008-4-21 18:58:34 | 相关网摘我也收藏

一个爬虫要做的事主要有以下这些

1. 从一个网页入口,分析链接,一层一层的遍历,或者从一组网页入口,或者从一个rss源列表开始爬rss;
2. 获取每个页面的源码保存在磁盘或者数据库里;
3. 遍历抓下来的网页进行处理,比如提取正文,消重等;
4. 根据用途把处理后的文本进行索引、分类、聚类等操作。



共4369个网摘 [ 1  2  3  4  5  6  7  8  9  10 ... 146 ]  上一页 | 下一页

zdg/相关标签



网站简介广告服务网站地图帮助联系方式诚聘英才English 问题报告
北京创新乐知广告有限公司 版权所有 京 ICP 证 070598 号
Copyright © 2000-2008, CSDN.NET, All Rights Reserved