テキストのエンコードを変換するUtility #python

pythonで文字コードの変換を行うときにちょっとだけ簡単になるよ。easy_install,pipでインストールできるよ。
easy_install textconverter
pip install textconverter

まぁ、これがやりたかっただけなんだけど。
from textconverter import convert

text = 'こんにちは'
text = convert.to_utf8(text)
text = convert.utf8_to_eucjp(text)

ソース:https://github.com/ukyo/textconverter
#coding: utf8

import types
import chardet

from method_missing import MethodMissing as MM


class TextConverter(MM):
def method_missing(self, name, *args, **kw):
if len(args) == 1:
return self.convert(name, args[0])
else:
return (self.convert(text) for text in args)

def convert(self, name, text):
if name.startswith('to_'):
encode_to = name[3:]
if type(text) == types.UnicodeType:
return text.encode(encode_to)
else:
encode_from = chardet.detect(text)['encoding']
return unicode(text, encode_from).encode(encode_to)
elif '_to_' in name:
encode_from, encode_to = name.split('_to_')
return unicode(text, encode_from).encode(encode_to)
else:
raise AttributeError, name

convert = TextConverter()



posted by 右京 | Python
blog comments powered by Disqus
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。