python - UnicodeEncodeError: 'ascii' codec can't encode character u'\xe4' -


मुझे स्थायी रूप से निम्न त्रुटि मिलती है:

  यूनिकोडएन्कोड त्रुटि: 'ascii' कोडेक नहीं कर सकता सांकेतिक शब्दों में कहें यू '\ xe4' स्थिति 27: क्रमिक संख्या में नहीं (128)  

मैंने पहले से ही कोशिश की

  1. x.encode (" ("एस्सीआई", "अनदेखा")
  2. x.encode ("utf-8")
  3. x.decode (" हालांकि, कुछ नहीं काम करता है।

    >

    आपको पता होना चाहिए कि स्रोत में यह एन्कोडिंग क्या है।

    मुझे लगता है कि यह आईएसओ -8859-1 (यूरोपीय भाषाओं) है, जिस स्थिति में यह "ए" है, लेकिन आपको चाहिए चेक। यह भी साइरिलिक या यूनानी हो सकता है।

    इस एन्कोडिंग में वर्णों की पूरी सूची देखें।

    इस जानकारी का उपयोग करके, आप इसे परिवर्तित करने के लिए पायथन से पूछ सकते हैं: < P> पायथन 2.7 में

      & gt; & gt; & gt; S = '\ xe4' & gt; & gt; & gt; T = s.decode ('iso-8859-1')> और gt; & gt; प्रिंट टी æ> & gt; & gt; सी में टी: ... प्रिंट ऑर्ड (सी) ... 228 & gt; & gt; & gt; यू = टी। कोड ('यूटीएफ -8')> और gt; & gt; & gt; प्रिंट यू एंडएडी & gt; & gt; सी के लिए बाइट्स (यू): ... प्रिंट ऑर्ड (सी) ... 195 164  

    स्ट्रिंग t आंतरिक रूप से आईएसओ -8859-1 में एन्कोडेड है पायथन में स्ट्रिंग u आंतरिक रूप से यूटीएफ -8 में एन्कोड किया गया है, और उस वर्ण को यूटीएफ -8 में 2 बाइट्स लेता है। नोटिस भी यह कि प्रिंट निर्देश "जानता है" इन भिन्न एन्कोडिंग को कैसे प्रदर्शित किया जाए।


Comments