Unicode

Sintaxi conversió Unicode <---> String - Python

Python Encode Decode

Unicode2Html

Conversió de carácters unicode a html. Es realitza un recorregut per cada carácter fent ús de htmlentitydefs

   1 from htmlentitydefs import codepoint2name
   2 str = u'Això és un cançò'
   3 ''.join([ord(c) in codepoint2name and "&%s;" % codepoint2name[ord(c)] or c for c in str])
   4 
   5 u'Aix&ograve; &eacute;s un can&ccedil;&ograve;'

Es pot fer més compacte amb generadors

   1 ''.join(ord(c) in codepoint2name and "&%s;" % codepoint2name[ord(c)]
   2 or c for c in str)

O amb l'operador ternari:

   1 ''.join("&%s;"%codepoint2name[ord(c)] if ord(c) in codepoint2name else c for c in str)

O com a funció:

   1 def fmt(c):
   2    r=codepoint2name.get(ord(c),c)
   3    return r if len(r)==1 else "&"+r+";"
   4 
   5 print ''.join(fmt(c) for c in s)


CategoryPython

Python/Unicode (last edited 2012-06-07 06:27:01 by zikzakmedia)

Contenidos creados por el equipo de Zikzakmedia. Creative Commons By-NC-SA

PythonZikzakmedia