首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 .NET Java 游戏 视频 人才 外包 数据库 第二书店 程序员

zdg/ 


共33个网摘 [ 1  2 ]  下一页  |  访问zdg的个人空间

百度宣布以闪存全面代替硬盘存储

zdg收录,使用标签:存储, Baidu,时间:2008-8-29 18:27:52 | 相关网摘我也收藏

8月19日消息,百度大规模拆空搜索服务器硬盘传闻获得百度官方证实,19日下午,百度宣布搜索服务器正式使用闪存(Flash Memory)技术代替硬盘并大规模商用,百度自称是全球首家服务器使用闪存技术的互联网公司。这是否预示着一个新的存储时代的到来?


艾瑞咨询:百度以娱乐内容创流量,以民生内容创收入

zdg收录,使用标签:baidu, Intelnet,时间:2008-4-11 19:49:32 | 相关网摘我也收藏

35岁以上群体多是拥有一定经济实力的用户,但其对新媒体的日常使用频率并不高,但其关注的主要内容却有较高的潜在商业价值,如投资理财、商务交易、旅游休闲、健康养生甚至是奢侈品消费等。新媒体运营商应当完善相应的内容展现,将最有价值的广告信息传达给用户。


原来所谓百度入股酷6是白送的股份!!

zdg收录,使用标签:Baidu, 视频, Intelnet,时间:2008-2-26 15:11:32 | 相关网摘我也收藏

酷6网竟在极短时间内击破百度与优酷网此前达成的入股意向,代价是600万元现 金和3%的赠送股份。


玩聚网和百度新闻的技术差异性

zdg收录,使用标签:玩聚, Baidu,时间:2008-1-11 19:18:38 | 相关网摘我也收藏

对于百度新闻来说,它比较省事儿,就是它的信息源基本上都是可以直接呈现在页面上的,毕竟都是新闻嘛,质量有保障,所以,它完全可以把一堆新闻放在队列A 中,然后每抓进来一个新闻就进行文本相似性比对,从而进行同类项合并;有多少条以上相似新闻的,就可以放出去形成静态页面了。当然,我这是简化了的说法。

而玩聚网不能这么玩的,玩聚网的信息源(几百万博客源 几十个论坛网站 几十个新闻网站)是庞杂的,文章质量是没有保障的(而techmeme则用手工建立A-List来保证源头的权威),而且抓到的新文章也数量太多,没办法像上面说的那么做,只能通过更复杂的文本挖掘技术来进行大规模计算,有点强行计算的感觉。于是玩聚网拥有了独门绝技:中文的热点自动发现技术,能够不需任何人工干预就自动计算出过去24小时内发生的热点,并得到了一个一个的精彩故事,有 博 文 有 帖子 有 图 片 有视频,互相之间还有关联。


百度新闻后台逻辑流程分析

zdg收录,使用标签:Baidu, 搜索技术,时间:2008-1-11 19:15:14 | 相关网摘我也收藏

今天分析了一下百度新闻,琢磨了一下其后台运行机制,出乎意料的是,我发现其运行机制比我想象的要简单,我原先没仔细看,以为至少会用到文本聚类,但是分析结果显示好像没用到,只是使用了文本分类和文本相似性计算而已。

下面简单描述一下其可能的运行机制,纯属个人分析,不保证正确性。

1.后台若干爬虫不间断的爬取各个新闻网站的最新新闻,网页HTML TAG过滤,得到新闻正文(解析出标题,发表时间,来源等元信息);

2.所有爬虫解析到的新闻存入某个POOL内,比如内存里建立新闻队列,积攒到一定量或者每隔一定时间(按照百度说法是5分钟),开始逐一进行处理;

3.对于每个新闻N,首先进行文本分类,分到国内,国际,财经,互联网等若干类别内;

4.计算新闻N和现有每篇新闻(最近5天内的)的相似性,如果和比如已有K篇新闻相似性大于一定值(比如>0.95),判断为已有新闻,不做处理(界面上某条新闻的“相同的K条新闻"就是这么计算得到的);


李彦宏揭秘:百度为什么推出自己的网站

zdg收录,使用标签:Baidu, 管理,时间:2008-1-10 18:56:53 | 相关网摘我也收藏

2006年以来,他开始对外界表达一种忧虑:中国在网民数量和GDP都已超过英国,但中国的搜索广告市场不过4亿美元规模,大概是英国的1/5。“媒体上报道中文的搜索量很可能已经超过了美国。这么大一个搜索量的情况下,整个付费搜索市场这么小,实际上意味着大量的搜索量被浪费掉了”,李说,中国的互联网市场不够成熟,让他颇有沮丧感。 这的确像一个两难困境。百度诚然需要专注,但略显无奈的是,它的利润比那些成立不久的网游公司还少。2007年第三季度,百度的净利润为1.817亿元人民币,而2006年才进入市场的巨人网络,靠《征途》一款游戏就在这个季度获得了2.9亿元的净利润。而且,似乎专注开发搜索相关产品,也很难给百度带来另一根利润支柱:Google将广告嵌入联盟网站的AdSense技术为其带来约40%的收入,但李彦宏觉得,如果流量质量更好的Baidu.com还有大量搜索行为没有被匹配好广告,现在去“大力开发网站联盟的流量价值,是不是一个正确的选择,都是一个问题”。

百度早年最独特的人才培养机制是让实习生像正常员工一样工作,每个人都要给自己的职位培养接班人。

几周下来,张以纬开始着眼于两个方面:技术部门员工的考核体系和激励机制。在百度,员工和团队的审评是按效率,如果产品做得快且质量稳定就能获得较高评级,这样的直接后果,是员工只能用加班来提高效率,从而忽略了产品架构的优化。“我希望他们有时间多思考,而不是陷于加班的巨大压力之中。”张说。 在此考虑下,张以纬首先在技术部的每个分部门都建立了技术委员会,由工程师担当委员,负责审评员工产品以及评定员工的技术职称。在审评标准中,增加了两个重要方面:一是技术价值,即所开发产品的质量和架构,其对公司的价值及未来价值;其二是人力资源价值。即在开发此项产品中工程师有没有提高。此项改革实施之后,首先能使工程师在开发产品时更注重其内在结构,也能使技术委员会的工程师开阔视野,获得成长。

同时,张还试图建立更科学的绩效评估体系。此前,百度员工项目进展和技术考核都由“经理”评定,而张建议让技术委员会接手员工的技术考核。另外,在上级员工的绩效评定中,也让他管理的下级员工参与打分。 最重要的是,在此基础上,张以纬可以着手下一个棘手的项目:薪酬体系调整。据说李彦宏有调整薪酬体系的想法久矣,但这牵扯的因素实在太多。首先,技术委员会对员工的考核保证了薪酬体系调整的客观性。张随后确定调薪原则,比如根据每个人的潜力而不是现有能力给员工股票,这种潜力的评价,一方面基于技术委员会的考核,另一方面在于和该员工谈的过程中张以纬对其的判断。


百度优化经验总结(实用)

zdg收录,使用标签:SEO, Baidu,时间:2007-10-8 18:14:41 | 相关网摘我也收藏

大家都知道,百度在中文搜索引擎市场占据着绝对老大的地位。一般来说,中文网站的流量60%以上来自百度。这不得不让我们重视对百度的优化。以下是我根据自已经历总结出来的一些百度优化的技巧!

百度与众不同之处:

Google的sandbax效应,Yahoo也有类似的现象。但是百度没有新站审核机制,新站如果优化的好可以得到不错的排名。
百度对一些内部因素特别敏感,比如标题、页面靠前的代码与加粗字的索引。
被百度自己称道的中文分词技术的真实情况我们并不知道,不过关键字符合程度,直接导致排名的不同,这和google区别最大的地方,Google在排列结果时,可以容忍相近词排在前列(与网站权重有关),但是百度这种情况比较少,除非没有连词被分析到,它才会排列自己认为的分词组合。
百度虽然反向链接查询形同虚设,但是它索引反向链接的速度是非常快的,这也就解释了为什么百度排名为什么更新那么快的原因,但是百度审核外部链接的机制可能不健全,(虽然是搜索引擎的通病,但是google还是引用了NoFollow标签来抵御spam)一些垃圾或是无效的链接也可能被肯定,采取人工干预或许是无奈之举。
百度优化步骤:

标题上下工夫,最好能包含自己认为有价值的关键字,但是需要注意的是标题长度维持在20个字,而且关键字不能重复。
页面重要位置加入少量的补充说明,例如首页做上方就是一个绝佳的位置。
我们多次实验认为更新速度绝对对排名有效果,文章的质量与原创是最重要的因素。
百度认为更新频率也是衡量一个网站质量的标准。让百度空手而归的结果不仅仅是索引时间加长,对排名也有影响。
合理的链接,我们反对优化百度时候做群链,因为这个被百度删除的站长不应该诉苦。
百度排名非常不稳定,而且过度优化会被惩罚。度的把握成了百度优化最大的难点。
综合百度与Google的不同,百度比较注重网站内容价值,Google则注重网站的被认同度,优秀的网站不是一朝一夕能建立起来,有各个方面的因素决定,排名也是如此,我们介绍的百度优化只是提供一些参考意见。请参考自己网站适当调整。如果有什么好的意见可以联系我们,进行深度分析。


[seo笔记]解决论坛收录问题-百度BBS收录协议

zdg收录,使用标签:SEO, BBS, Baidu,时间:2007-9-17 18:29:47 | 相关网摘我也收藏

Kyw的百度BBS收录协议阅读笔记如下:
1. 百度BBS收录协议是一个XML文件,作用类似GOOGLE的SITEMAP.XML文件。
2. XML文件的大小控制在10M内。
3. 百度BBS收录只是对百度蜘蛛原有收录方式的一种协助和有益补充,而不是取代。
4. 采用了百度BBS收录协议后,就相当于论坛中的帖子被百度订阅。
5. 支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB2312和UTF-8。
6. 注意XML文件头部的encoding值必须与XML文件的实际编码类型一致。
7. XML标签内容中的一些特殊字符需要转换为XML定义的转义字符。
8. 请保持每个XML文件处于按更新周期持续自动更新的状态。
9. 一个站点不可以提交多个不同的XML,否则可能会被识别为利用《论坛开放协议》作弊。


百度文化理念

zdg收录,使用标签:Baidu, 企业文化,时间:2007-2-18 23:27:50 | 相关网摘我也收藏

和百度过去价值观有所不同,百度新的文化核心是:“让人们更便捷地获取信息,找到所求”、“专注”、“分享”、“求是”、“系统”、“卓越”、“惜时”。

这不仅是一家正在走向伟大的公司的理念,我认为,它对个人的成长更有参考意义。


之前写的一个空间类产品对比分析

zdg收录,使用标签:MySpace, Baidu, SNS,时间:2007-2-5 14:35:34 | 相关网摘我也收藏

个人空间市场的几大特征:

1) 用户群居性较强 (学生用户、低端用户、高端用户会各自抱团)
2) 地域性较强(地域跨度大的交友服务很难实现线下互动,用户实现目的的意图无法实现)
3) 对产品功能依赖性小,但对服务和使用感受等易用性要求较高
4) 用户对社区人气非常敏感


百度产品2006回顾

zdg收录,使用标签:Baidu, 搜索市场,时间:2007-2-4 13:30:56 | 相关网摘我也收藏

看这些产品的相继有序推出,层层叠叠不断在强化社区服务/优化搜索体验方面起到其必然作用.总结有如下5个特点:

1 知识搜索体系构建完成。
2 搜索社区化体系中内容更加丰富。
3 个人网络应用展开。
4 搜索应用:试水垂直搜索
5 搜索内容合作模式成熟


社区研究系列(1):“百度搜藏”的一个细节

zdg收录,使用标签:Baidu, 网摘,时间:2007-1-22 22:45:27 | 相关网摘我也收藏

总结一下,就网摘登录这个细节,排除自动登录外,就有三种设计思路。第一是中规中矩,先登录,后网摘;第二是我修改的先网摘,再登录;第三就是百度,先显示网摘,然后登录,最后网摘――这三种方法中,第一种方法无论从哪方面看,都是最差的产品思路;而我的方法和百度搜藏的方法,相比第一方案,都是一种更优化的方法,但反映了我和百度搜藏项目组不同的设计理念――我更追求最终结果,百度搜藏更追求用户体验。至少在这个产品细节上,我更实用主义一些。因此现在让我选择,我还是会坚持自己的方案――但我自己使用,则更喜欢百度搜藏的方案。


搜索引擎定向广告策略--以百度为例

zdg收录,使用标签:搜索技术, AD, Baidu,时间:2006-12-16 14:20:28 | 相关网摘我也收藏

百度处理模糊关键词匹配的方法是:分析用户查询,比如用户输入“海鲜花 彩铃”,先根据空格信息分成两个子成分“海鲜花”和“彩铃",然后两个字符串序列和广告词数据库执行多模式匹配策略,得到如下的匹配结果:”海鲜“,"鲜花”,“彩铃”四个匹配结果,然后按照一定标准输出到右侧广告栏,这个输出策略可能跟企业购买关键词的出价有关,比如出价高的排列在前面,同时输出结果不超过比如10个等等。


百度的思路

zdg收录,使用标签:Baidu, SEO,时间:2006-12-15 22:52:14 | 相关网摘我也收藏

百度品牌总监王东发给李彦宏和梁冬的内部邮件被泄露出来,邮件内容显示,”由于新浪对百度的负面报道颇多,百度调低了搜索新浪内容的权重;但近段时间以来,新浪对百度的支持加大,因此王东向李彦宏和梁冬请示是否可以‘恢复新浪的权重而将搜狐调低’。之所以要调低搜狐的权重,也是出于“对百度的负面报道较多”的原因。在这封邮件中还详细列举了新浪专题被收录的情况,以作证明。”


缔造中国最大搜索引擎的幕后角色们正纷纷拷贝、粘贴李彦宏的创业密码

zdg收录,使用标签:创业, Baidu,时间:2006-12-6 1:54:27 | 相关网摘我也收藏

这是一个罕见的创业群落。这些百度的早期员工在因不同原因离开百度之后,一直保持着长期的友谊,并由于接连创业而达成了更为紧密的 联合。正因 此,在今年初段晖的婚礼上,谌振宇提议各自创业的朋友们有必要定期聚会一次,迅速得到了所有人的认同。而这个“逐鹿会”的确尽其所能:参与者不仅共享商业判断(如酷讯开通二手车版块就得益于聚会上的讨论)、经验(新近离职的前首席架构师周利民于11月首次参加聚会,就应邀向众人提供很多建议),还疏通人脉(投资酷讯后,联创策源投资基金继而找到了抓虾),寻求合作可能(如抓虾上可以订阅酷讯的资讯和一见的视频)。


百度进军网摘领域悄然测试搜藏频道

zdg收录,使用标签:网摘, Baidu,时间:2006-11-22 20:32:21 | 相关网摘我也收藏

11月22日消息,百度日前已悄然开始测试“搜藏”频道,不日将进军网摘领域。目前,域名为cang.baidu.com的测试页面已经开通,消息人士透露,百度计划于本月底正式对外发布。

根据测试页面显示,该网摘功能将免费向网友提供,包括“全文收藏”、“快速查找”、“网页快照”等基本功能,除此之外,网友在百度搜藏的资源还可与网友进行分享


百度的崛起

zdg收录,使用标签:Baidu,时间:2006-9-22 13:37:01 | 相关网摘我也收藏

今年上半年,百度公司的营业收入增加了190%,达到了4090万美金,净利润增长550%,达到1170万美金。百度网站正吸引数以百万计的年轻人们去下载音乐、创建博客、搜索“中国最美丽的10位女性”的图片。当百度高速增长的同时,其收入仍然无法和Google今天预期的70亿美金相比。分析家认为百度面对的用户和西方互联网公司所面对的不同,因为中国用户对娱乐的兴趣远远大于新闻、书籍和汽车租赁。“在中国,有70%的网民年龄地域30岁,”摩根士丹利的副总裁兼分析家Richard Ji说,“大部分的网民是单身,没有小孩儿,他们希望得到娱乐。”


百度空间发表带脚本文章的12招

zdg收录,使用标签:javascript, blog, Baidu,时间:2006-8-31 17:47:44 | 相关网摘我也收藏

上面列出的12个例子都可以做到脚本执行(至少保证在IE6下没问题)。借助百度发帖助手,我们很容易在文章中嵌入这样的HTML标签。当然这只是一些思路,或者入手点,12个例子之间有些是可以彼此配合使用的,通过组合搭配,我们可以得到几十种甚至更多嵌入脚本的方法。


SEO,什么时候学会与百度共舞?

zdg收录,使用标签:SEO, Baidu,时间:2006-8-7 2:20:48 | 相关网摘我也收藏

中国的SEO们大多是Google排名者(有时候我自己也难以避免)。每天不知道有多少的网站悄悄地从百度消失得无影无踪,却从没有对客户提起,或者就简单地把罪名推向百度.这样的案例已经接触了太多太多,随便在网上找一些Google排名这的案例稍加分析,就大致可以发现大部分中国SEO们在google排名成功的同时被百度给删除了。


百度空间:中国出了个myspace

zdg收录,使用标签:Baidu, myspace, blog,时间:2006-7-17 23:09:10 | 相关网摘我也收藏

大家都知道,很多社区都有虚拟积分,或者说,“虚拟积分”似乎已经成了网络社区的标配。但是百度不这么做,百度一上来就玩真的,直接推出需要用钱购买的“百度币”――相对于那些迄今还没有把虚拟积分“挂钩”人民币的网络社区来说,百度的实用主义思路干净利落,目的性极强。


百度世界点点

zdg收录,使用标签:Baidu,时间:2006-7-16 2:34:30 | 相关网摘我也收藏

值得赞扬的一点是替换地址栏功能,google toolbar只是在firefox中替换了搜索栏,搜霸更彻底,直接把IE的地址栏踢飞,如果安装了工具条,上面几个输入框确实比较浪费,搜霸的搜索输入框直接把地址栏的功能接管了,确实不错。


在Google上不去的日子:百度CTO刘建国如是说

zdg收录,使用标签:Google, Baidu,时间:2006-6-15 0:50:15 | 相关网摘我也收藏

几天前Google联合创始人塞吉


出多少钱?

zdg收录,使用标签:搜索市场, Google, Baidu,时间:2006-5-15 15:36:41 | 相关网摘我也收藏

# 2004年Google的营收是百度的218倍,2005年为155倍,双方差距有所缩小;但是,# 2005年较之2004年,在广告客户的平均年支出方面,百度下降了8%(从686美元降至629美元),Google上升了42%(从11,390美元升至16,239美元);因此,# 2005年,百度的广告客户增加约200%,营收只增长171.8%;Google的广告客户增加35%,营收却增长92.5%;可见,# 2005年,百度营收的增长,要全部归功于广告客户的新增(老客户缩减8%的开支,甚至还拖了后腿);而Google营收的增长,则来自老客户广告开支的加大,以及广告客户的新增两个方面。


百度CTO刘建国:社区化与个性化是搜索未来方向

zdg收录,使用标签:Baidu,时间:2006-4-24 1:24:29 | 相关网摘我也收藏

一项新产品开发之前,百度样判断这个产品是不是符合百度的定位呢?在被问到GOOGLE开发了很多稀奇古怪的产品,百度有没有考虑这样做时,刘建国表示:“百度不会做稀奇古怪的产品,不会做一些用户不会用到的,但是用起来非常酷的东西,我们认为这个东西没有价值,产品必须要给网民带来价值。”


百度百科发布

zdg收录,使用标签:Baidu, Wiki,时间:2006-4-23 0:48:37 | 相关网摘我也收藏

百度百科的交互的设计的很成功,编辑很简单直接,没有晦涩难懂的功能,而且引入了TAG式分类体系,让内容的再组织变得很方便.词条如何标准化,谁来作是非的仲裁?看目前的设计好像是说没有正确与否的标准,最后编辑的内容为主要显示内容,但是已往的历史版本都作完整版保留,而且每次编辑都会明确要求填写原因.


贴吧两岁啦!

zdg收录,使用标签:Baidu,时间:2005-11-10 22:12:49 | 相关网摘我也收藏

百度贴吧:平均每天新建8000余个贴吧;平均每天新发2000000余个新帖;平均每天有80位吧主当选,走上他们的工作岗位;平均每天有6000余位新朋友来到百度贴吧安家;ID豆沙包平均每天发贴近400个,当之无愧为一代水王;被点击最多的ID:du熊;2005年第一热门贴吧:李宇春吧,拥有500000余个主题,10000000余个帖子;拥有最多回复的帖子:截止目前回复数已超过120000


笨蛋BaiDu和聪明DangDang

zdg收录,使用标签:ECommerce, Baidu, Dangdang,时间:2005-10-29 11:22:20 | 相关网摘我也收藏

小聪明对于成功与否是起不到决定性作用的,能不能真的立足搜索和C2C,还得拼点真功夫和真金白银。


百度之星程序设计大赛-第一题

zdg收录,使用标签:Baidu, 比赛,时间:2005-10-1 2:05:03 | 相关网摘我也收藏

本来百度是要求用标准C/C 写,不过这题不要求效率,我就用C#随便试试。题目不难,但如果还是想考虑效率的话,我想递归应该是比较好的选择。等有时间想想递归算法在刷新这贴。后面还有3道题,这里下载题目,有兴趣自己试试。


“程序之美”-百度之星程序设计大赛

zdg收录,使用标签:Baidu, Search, 比赛,时间:2005-9-12 23:49:50 | 相关网摘我也收藏

本次大赛面向全国高校的广大在校学生,同样盛情邀请喜欢发现最佳算法和数据结构以解决各种挑战性问题的程序员高手,旨在为广大程序设计爱好者提供一个展现自我的舞台。



共33个网摘 [ 1  2 ]  下一页

zdg/相关标签



网站简介广告服务网站地图帮助联系方式诚聘英才English 问题报告
北京创新乐知广告有限公司 版权所有 京 ICP 证 070598 号
Copyright © 2000-2008, CSDN.NET, All Rights Reserved