存档

‘互联网’ 分类的存档

如何高效使用搜索引擎

2013年4月5日 4 条评论

google

1、双引号

把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd和Google 都支持这个指令。例如搜索: “java高性能程序开发”

2、减号

减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和bd都支持这个指令。
例如:搜索 -引擎
返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果

3、星号
星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。
比如在Google 中搜索:搜索*擎
其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”,“搜索巨擎”等内容。

4、inurl
inurl: 指令用于搜索查询词出现在url 中的页面。bd和Google 都支持inurl 指令。inurl 指令支持中文和英文。
比如搜索:inurl:jvm

返回的结果都是网址url 中包含“jvm”的页面。由于关键词出现在url 中对排名有一定影响,使用inurl:搜索可以更准确地找到竞争对手。

5、inanchor
inanchor:指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持inanchor。
比如在Google 搜索 :inanchor:点击这里
返回的结果页面本身并不一定包含“点击这里”这四个字,而是指向这些页面的链接锚文字中出现了“点击这里”这四个字。
可以用来找到某个关键词的竞争对收,而且这些竞争对手往往是做过SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。 阅读全文…

分类: 互联网 标签: ,

Chrome和goagent的配置方法,你懂的

2013年3月31日 2 条评论

1、注册GAE帐号

gae

2、在GAE创建一个新的application

3、下载goagent最新版本

goagent 阅读全文…

分类: 互联网 标签: ,

Hacker News排名算法分析

2013年3月31日 没有评论

Hacker News使用Paul Graham开发的Arc语言编写,源码可以从https://github.com/nex3/arc/下载。下图是其排名算法实现:

arc

数学公式为:

score

P表示帖子的得票数,减去1是为了忽略发帖人的投票。在其他条件不变的情况下,得票越多,排名越高。
T表示距离发帖的时间(单位为小时),加上2是为了防止最新的帖子导致分母过小(之所以选择2,可能是因为从原始文章出现在其他网站,到转贴至Hacker News,平均需要两个小时)。在其他条件不变的情况下,越是新发表的帖子,排名越高。或者说,一个帖子的排名,会随着时间不断下降。
G表示”重力因子”(gravityth power),即将帖子排名往下拉的力量,默认值为1.8。它的数值大小决定了排名随时间下降的速度。

分类: 互联网 标签: , ,

中国黑客传说:游走在黑暗中的精灵

2013年3月26日 1 条评论

V

他是我所认识的最强大的地下黑客之一,在本文中我姑且称他为V。

之所以是之一,是因为我还认识另外一个叫A的黑客,A宣称自己成功入侵了包括Google、Facebook、Twitter等你几乎能叫得上名字的所有大型互联网公司。

而V要低调的多。

我认为V已经是地下黑客世界中的王者,虽然他从不肯告诉我他入侵的那些公司的名字,但我仍然会毫不犹豫的将他列为当今世界上最强大的黑客之一。

V至今仍恪守着古老的黑客守则,就如同中世纪的骑士们执着于骑士精神一般。他从不在任何公众场合谈论入侵了什么网站,入侵后也从不删除数据或是进行破坏,他也不会用入侵获得的成果来牟利。

V只是一个人,他的身后没有任何的机构或组织,因此才更加的难能可贵。

幽灵

“我曾经持续观察了一个女孩3年,3年中一直看着她和男朋友谈情说爱。她是个美女,我只见过她两次,是朋友的朋友。

最后她没有选择一直在谈情说爱的男朋友,而是和一个比她大了8岁的男人结婚。当她和那个比她大8岁的男人的结婚照出现在相册时,我彻底被现实社会给击败了。”

V坦诚,有时候他喜欢窥探他人的隐私。我告诉他,窥私欲是人类的天性,是所有黑客走上黑客之路的源动力。

QQ查找好友的“可能认识的人”,把女孩推荐给了V(朋友的朋友)。女孩用自己的照片做了头像,所以一眼就能认出来。随后V查看了女孩的个人资料,知道了女孩的邮箱地址。V查出了女孩用的网易邮箱的密码(下文会解释),发现密码很有规律,是“姓名全拼+!@#”,或者“woaini+生日+姓名全拼”。

V进入女孩的邮箱后,发现女孩注册了12306用来订火车票。V通过这个注册邮箱,获取了女孩在12306的密码。登录12306后,V得到了女孩和她家人的所有身份证信息以及出行记录。同时女孩在携程上预订的机票信息也会发送到这个邮箱。自此,女孩只要出行想去什么地方,去过哪里,全都在V的掌控之中。 阅读全文…

分类: 互联网 标签: ,

Amazon反应速度超快的下拉菜单

2013年3月12日 1 条评论

如果你以前觉得 Amazon 这家公司不太在用户体验上下功夫,这篇文章可能会改变你的看法。

god

Amazon主页的左上角有一个商品分类浏览的下拉菜单。当鼠标从菜单中的选项上滑过时,子菜单的显示速度是超快的。我们可以看一下:

menu 阅读全文…

分类: 互联网 标签:

404页面

2013年1月6日 没有评论

 

修改博客404页面,腾讯是个有担当的公司,赞一个!

 

分类: 互联网 标签:

大数据处理系列(一)

2012年10月22日 没有评论
以下是大数据处理中需要用到的,先列到这,以后逐个突破
1、Bloom Filter
2、Hash
3、Bit-Map
4、堆(Heap)
5、双层桶划分
6、数据库索引
7、倒排索引(Inverted Index)
8、外排序
9、Trie树
10、MapReduce
分类: 互联网 标签:

网页特征识别方法

2012年10月17日 没有评论
	分类实现方式(主要还是基于词频统计,但具体实现做了优化):
		1.定义一套自己的分类,例如取一淘分类
				但有一个原则最终子类只表示一类商品,不会表示多个分类,
				例如:手机、保护套、mp3、单反相机,不会有手机通信这种分类,便于以后分词
使用用
	  2.这些分类词要放到分词词库中,用该词库对网页分词,防止出现将手机套分为手机和套这种分词
	  3.基于分类词对网页进行词频统计,词频最高的分类词即为网页的分类
	    3.1 统计中需要处理的问题:
	    	等价词(手机套、保护套、手机壳等)
				页面中有(title)、页面描述(description)、关键词 (keywords)、超链接文本、纯文本等 。这些属性都可能包含分类信息,但权重是不同的;
				前期可以使用title、keyword、description和标题进行统计
				例如:对商品“ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋)”
进行统计
				<meta name="description" content="ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋), 品牌: ESK, ESK, ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋)<br>1.专业保护您的iphone,完美贴合使您的iphone 看起来更完美·<br>2.ESK501是采用进口材料,镭射工艺制程,完美的产品让您的爱机更加美观<br><br/><img src='http://g-ec4.images-amazon.com/images/G/28/hardline-asin/20120423-BQNP-01.jpg'><br><br/..." />
				<meta name="title" content="ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋)-小家电-卓越亚马逊" />
				<meta name="keywords" content="卓越,亚马逊,卓越亚马逊,卓越网,joyo,amazon,joyo amazon,小家电,ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋),ESK" />
				<title>ESK 苹果 iPhone4/iPhone4s 浮雕 个性超薄 手机壳 保护外套 (天堂小屋)-小家电-卓越亚马逊</title>
				最后统计的词频是手机壳,则这个商品的分类就是手机壳
		4.建立分析样本,前期做的词频统计的结果都是通过人工看的方式来评价结果,正确的做法
		应该是对已知样本来进行统计,在已知样本上来统计结果的正确率,根据正确率来调整或决
		定使用不使用该算法。
		例如:我们已经按照自己的分类规则对100个网页打好标签,然后用自己的统计方法对这些网站分类,
					如果有N个网页分类正确,则我们的正确率就是N/100。
分类: 互联网 标签:

host与domain区别

2012年9月22日 没有评论

举例说明:

domain是指:sinaapp.com

host则是:chinageek.sinaapp.com

分类: 互联网 标签: ,

新浪sae最新java邀请码(已全部送出)

2012年9月21日 11 条评论

9月21日最新java邀请码

77ed09

2483b5

c34818

05966f

还有一个保留,想要的留言留下邮箱

 

分类: 互联网 标签: , ,