MongoDB
 sql >> Base de données >  >> NoSQL >> MongoDB

l'insertion mongodb montre que "les chaînes dans les documents doivent être valides UTF-8"

Si vous utilisez PyMongo et Python 2.x, vous devez utiliser str dans les chaînes utf-8 ou unicode. Voir :http://api.mongodb .org/python/current/tutorial.html#a-note-on-unicode-strings

Si data est un dict avec plusieurs chaînes, vous pouvez toutes les convertir en unicode en utilisant la fonction suivante :

def convert2unicode(mydict):
    for k, v in mydict.iteritems():
        if isinstance(v, str):
            mydict[k] = unicode(v, errors = 'replace')
        elif isinstance(v, dict):
            convert2unicode(v)

for code, data in dict_data.items(): 
    try:
        convert2unicode(data)
        collection2.insert({'_id':code,'data': data})
    except Exception as e:
        print code,'>>>>>>>', str(e)
        sys.exit()

Le code précédent convertira toutes les valeurs str en unicode, les "clés" restent intactes, selon la cause première, vous devez également convertir les "clés".