MongoDB的Python驱动PyMongo

文章由LinuxBoy分享于2019-03-30 03:03:08热评（115）

MongoDB的Python驱动PyMongo

创建连接

>>> import pymongo
>>> connection=pymongo.Connection('localhost',27017)
切换数据库

>>> db = connection.test_database
获取collection

>>> collection = db.test_collection
db和collection都是延时创建的，在添加Document时才真正创建

文档添加，_id自动创建

>>> import datetime
>>> post = {"author": "Mike",
... "text": "My first blog post!",
... "tags": ["mongodb", "python", "pymongo"],
... "date": datetime.datetime.utcnow()}
>>> posts = db.posts
>>> posts.insert(post)
ObjectId('...')
批量插入

>>> new_posts = [{"author": "Mike",
... "text": "Another post!",
... "tags": ["bulk", "insert"],
... "date": datetime.datetime(2009, 11, 12, 11, 14)},
... {"author": "Eliot",
... "title": "MongoDB is fun",
... "text": "and pretty easy too!",
... "date": datetime.datetime(2009, 11, 10, 10, 45)}]
>>> posts.insert(new_posts)
[ObjectId('...'), ObjectId('...')]
获取所有collection（相当于SQL的show tables）

>>> db.collection_names()
[u'posts', u'system.indexes']
获取单个文档

>>> posts.find_one()
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}
查询多个文档

>> for post in posts.find():
... post
...
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}
{u'date': datetime.datetime(2009, 11, 12, 11, 14), u'text': u'Another post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'bulk', u'insert']}
{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'and pretty easy too!', u'_id': ObjectId('...'), u'author': u'Eliot', u'title': u'MongoDB is fun'}
加条件的查询

>>> posts.find_one({"author": "Mike"})
高级查询

>>> posts.find({"date": {"$lt": d}}).sort("author")
统计数量

>>> posts.count()
3
加索引

>>> from pymongo import ASCENDING, DESCENDING
>>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)])
u'date_-1_author_1'
查看查询语句的性能

>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"]
u'BtreeCursor date_-1_author_1'
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"]
2
附自己总结的一点小心得，仅供参考

缺点

不是全盘取代传统数据库（NoSQLFan：是否能取代需要看应用场景）不支持复杂事务（NoSQLFan：MongoDB只支持对单个文档的原子操作）文档中的整个树，不易搜索，4MB限制？（NoSQLFan：1.8版本已经修改为16M）
特点（NoSQLFan：作者在这里列举的很多只是一些表层的特点）：

文档型数据库，表结构可以内嵌没有模式，避免空字段开销（Schema Free）分布式支持查询支持正则动态扩展架构32位的版本最多只能存储2.5GB的数据（NoSQLFan：最大文件尺寸为2G，生产环境推荐64位）
名词对应

一个数据项叫做 Document（NoSQLFan：对应MySQL中的单条记录）一个文档嵌入另一个文档（comment 嵌入 post）叫做 Embed储存一系列文档的地方叫做 Collections（NoSQLFan：对应MySQL中的表）表间关联，叫做 Reference

推荐文章：

MongoDB的Python驱动PyMongo