Unicode

Sintaxi conversió Unicode <---> String - Python

Python Encode Decode

Unicode2Html

Conversió de carácters unicode a html. Es realitza un recorregut per cada carácter fent ús de htmlentitydefs

  1 from htmlentitydefs import codepoint2name
  2 str = u'Això és un cançò'
  3 ''.join([ord(c) in codepoint2name and "&%s;" % codepoint2name[ord(c)] or c for c in str])
  4 
  5 u'Aix&ograve; &eacute;s un can&ccedil;&ograve;'

Es pot fer més compacte amb generadors

  1 ''.join(ord(c) in codepoint2name and "&%s;" % codepoint2name[ord(c)]
  2 or c for c in str)

O amb l'operador ternari:

  1 ''.join("&%s;"%codepoint2name[ord(c)] if ord(c) in codepoint2name else c for c in str)

O com a funció:

  1 def fmt(c):
  2  r=codepoint2name.get(ord(c),c)
  3  return r if len(r)==1 else "&"+r+";"
  4 
  5 print ''.join(fmt(c) for c in s)


CategoryPython

Python/Unicode (last edited 2012-06-07 06:27:01 by zikzakmedia)

Contenidos creados por el equipo de Zikzakmedia. Creative Commons By-NC-SA

PythonZikzakmedia