MongoDB学习笔记(二)

主从集群
mongodb支持在多个机器中通过异步复制达到故障转移和实现冗余。多机器中同一时刻只有一台是用于写操作。由于这种情况,为mongodb提供了数据一致性的保障。担当primary角色的机器能把读操作分发给slave。
MongoDB的主从集群分为两种:Master-Slave复制(主从) Replica Sets复制(副本集)

.Master-Slave复制(主从)
只需在某一台服务器启动时加上-master参数,而另一个服务器上加上-slave与-source参数,即可实现同步(最新版本已不推荐此种方式)
mongod –master –dbpath=/var/mo[......]

Read more


[转]Reddit的排名算法

与文章新闻类排名不同的事,评论类的算法可能发表时间没有什么关系。目前很多网站采用的评论排名主要有两种,即绝对好评数(好评减去差评)和好评率(好评/总评)。这两种评价方式 都存在很明显的缺陷,以下为事例:

  • A:好评550; 差评450
  • B:好评60;差评40
  • C:好评1;差评0
  • D:好评9,差评1

首先是A与B比较,A的绝对好评数是550-450=100,B的绝对好评数是60-40=20,从绝对好评数比较,A的排名应该在B的前面;A的好评率为550/(450+550)=55%,B的好评率为60/(40+60)=60%,从好评率来说B的排名要比A的排名好。

再来比较[......]

Read more


神奇的TCP Self Connect

在发起localhost对localhost的TCP连接时有一定几率产生这个现象
场景复现:

while true
do
    telnet 127.0.0.1 55555
done

在CentOS执行这段脚本,过一段时间就会出现下面这个现象,内核版本2.6.32-279.14.1.el6.openlogic.x86_64

telnet: connect to address 127.0.0.1: Connection refused
Trying 127.0.0.1...
telnet: connect to address 127.0.0.1: Connec[......]

Read more


正则表达式基本语法

\
将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,“n”匹配字符“n”。“\n”匹配换行符。序列“\\”匹配“\”,“\(”匹配“(”。

^
匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与“\n”或“\r”之后的位置匹配。

$
匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与“\n”或“\r”之前的位置匹配。

*
零次或多次匹配前面的字符或子表达式。

+
一次或多次匹配前面的字符或子表达式。

?
零次或一次匹配前面的字符[......]

Read more


拆招大数据:颠覆边缘行业的无影掌

在银河帝国系列科幻小说中,数学家哈里·谢顿开创了“心理史学”,他能够运用数学公式准确预测人类的未来,作者艾萨克·阿西莫夫凭借其丰富的想象力被全球读者誉为“神一样的人”。如今,小说里预知未来的桥段在某种程度上已经实现,不过不是凭借“心理史学”,而是归功于“大数据”。

大数据是近几年的热词,但从根源上讲其方法论不过是传统的统计学。只是随着人类的信息被数字化,数据越来越多,再加上存储与计算能力逐步提高,此时把统计学和庞大的数据融合在一起便对很多产业产生了颠覆效果。

中国社科院经济与政治研究所副所长何帆就是个大数据的推崇者,他相信大数据可以实现很多闻所未闻的事情。比如,社科院可以通过一个人[......]

Read more


释放压力的九种方法

1.欣赏艺术品有助于释放压力
英国威斯敏斯特大学(The University of Westminster)的研究人员组织28名工作压力较大的人到艺术画廊欣赏艺术品,欣赏时间持续约40分钟。研究人员通过测量唾液中的皮质醇激素浓度,判断人的压力状态。
威斯敏斯特大学的研究人员发现:与参观前相比,参观艺术品后人的唾液中包含的皮质醇激素水平降低了32%,一般情况下,要想使皮质醇激素降低这个幅度,大概要5个小时,说明欣赏艺术品能够较好的释放压力。
2.欣赏自然美景有助于缓解压力
美国华盛顿大学(University of Washington)的研究人员把90名志愿者分成3个小组,A组欣赏自[......]

Read more


新一代的Hadoop大数据挖掘平台和生态介绍zz

大数据革命正以Apache Hadoop为中心如火如荼的进行着。自从开源分布式数据处理平台在5年前发布时讨论之声就不绝于耳。在过去的一年中,Hadoop赢得了客户的认可,并得到众多商业化的支持以及众多数据库和数据集成软件商的整合。

 

Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。这种处理多类型数据的能力非常重要。它催生了NoSQL平台和产品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL数据库。

而传统关系型[......]

Read more


python学习之类(class)

python 中的类和我们一般静态语言中的类不太一样

1. python中类的初始化是通过__init__ 函数来完成的

2. python中类的析构是通过__del__函数来完成的

3. python 中定义的函数第一个参数必须为self, 而在类的内部调用函数的时候 必须是 self. xxx 不然就无法识别 这个类函数. 这和c/c++中this有点类似, 但是却不像c/c++那样可以不写.

4.python 支持多继承, 但基类 __init__和__del__ 需显示调用, 并且继承方法的调用和基类的声明顺序有关系


腾讯正式宣布入股京东商城:以QQ网购、拍拍网全盘资产外加2.15亿美元现金,收购京东上市前15%股份

腾讯和京东的故事,终于画上了句号。

今天腾讯正式对外发布公告,腾讯旗下电商资产 QQ 网购和拍拍实物电商部门以及配送团队将整合到京东,并支付支付 2.15 亿美元现金,收购京东上市前 15% 股份。等到京东正式上市的时候,腾讯还将有权利以招股价认购京东额外的 5% 股份。另外腾讯总裁刘炽平将加入京东董事会。

双方的合作框架包括:1)双方将在电商领域展开战略合作;2)腾讯为京东提供移动平台应用的合作支持;3)双方将在移动支付上展开合作;4)在若干合作领域,京东将成为腾讯的优先合作伙伴;5)腾讯将不再从事和京东有竞争的业务。

具体到业务层面,腾讯目前所有的电商业务,如 B2C 平[......]

Read more


利用mongodb开发lbs应用实践

近期作为突击队员,与同事一起突击构建了一个简单的lbs系统。当前比较主流的做法是使用mongodb,因为其已经封装了常用的lbs基本操作(如查找附近的人),功能非常强大,对于开发周期只有一周的项目,mongodb真可谓是救世主,把最重要的需求给完成了,谢天谢地!

mongodb是比较著名的nosql db,想了解的同学不妨问问谷歌或度娘,对于专业问题本人倾向于问谷歌。本文还参考了这篇文章。我们使用的是目前最新版本的mongodb-2.4.9。

首先从mongodb提供的lbs功能讲起:mongodb支持以下几种查询:

1.区域内搜索:所谓区域内搜索,即列出附近一定范围内的所有[......]

Read more